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(57) Abstract 

The invention concerns recombinant vectors replicated in mycobacteria, a set of sequences coding for exported polypeptides detected 
by fusion with alkaline phosphatase, in particular one polypeptide, called DP428, of about 12 kD corresponding to an exported protein found 
in mycobacteria belonging to the Mycobacterium tuberculosis complex. The invention also concerns methods and kits for detecting in vitro 
the presence of a mycobacterium and in particular a mycobacterium belonging to the Mycobacterium tuberculosis complex in a biological 
sample using said polypeptides, their fragments or polynucleotides coding for the latter. The invention also concerns immunogenic or 
vaccine compositions for preventing and/or treating infections caused by mycobacteria and in particular a mycobacterium belonging to said 
complex, particularly tuberculosis. 

(57) Abrege' 

L* invention a pour objet des vecteurs recombinants se replicant chez les mycobactenes, un ensemble de sequences codant pour 
des polypeptides exportes d6tect6s par des fusions avec la phosphatase alcaline, notamment un polypeptide, denomme DP428, d'environ 
12kD correspondant a une proteme exportee retrouvee dans les mycobactenes appartenant au complexe de Mycobacterium tuberculosis, 
V invention concerne 6galement des procddes et des kits de detection in vitro de la presence d*une mycobacterie et en particulier une 
mycobacterie appartenant au complexe de Mycobacterium tuberculosis dans un echantillon biologique utilisant lesdits polypeptides, lews 
fragments ou des polynucleotides codant pour ces derniers. L' invention vise des compositions immunogenes ou vaccins pour la prevention 
et/ou le traitement d' infections provoquees par des mycobactenes et en particulier une mycobacterie appartenant audit complexe, en 
particulier la tuberculose. 
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Sequences nucleiques de polypeptides exportes de 
mycobacterias, vecteurs lea comprenant et applications au 
diagnostic et a la prevention de la tuberculosa. 

5 L 1 invention a pour objet de nouveaux vecteurs 

recombinants de criblage, de clonage et/ou d ! expression se 
r^pliquant chez les mycobacteries. Elle a egalement pour 
objet un ensemble de sequences codant pour des polypeptides 
exportes d6tect6s par des fusions avec la phosphatase 

10 alcaline et dont 1* expression est regul^e (induite ou 
reprim^e) ou constitutive lors de 1* ingestion des 
mycobacteries par les macrophages. L' invention concerne 
egalement un polypeptide, denomme DP428, d' environ 12kD 
correspondant a une proteine exportee retrouvee dans les 

15 mycobacteries appartenant au complexe de Mycobacterium 

tuberculosis. L 1 invention vise aussi un polynucleotide 

comprenant une sequence codant pour ce polypeptide. Elle 
concerne egalement 1 ' utilisation du polypeptide ou de 
fragments de celui-ci et des polynucleotides codant pour 
20 ces derniers (ou encore les polynucleotides complementaires 
a ces derniers) pour la realisation de moyens de detection 
in vitro, ou in vivo de la presence d'une mycobacterie 
appartenant au complexe de Mycobacterium tuberculosis dans 

un echantillon biologique ou pour la detection de reactions 
25 de l'hote infecte par ces especes bacteriennes . L 1 invention 
vise enfin 1 1 utilisation du polypeptide ou de fragments de 
celui-ci ainsi que des polynucleotides codant pour ces 
derniers en tant que moyens destines a la preparation d'une 
composition immunogene, susceptible d'induire une reponse 
30 immunitaire dirigee contre les mycobacteries appartenant au 
complexe de Mycobacterium tuberculosis, ou d'une 

composition vaccinale pour la prevention et/ou le 
traitement d' infections provoquees par des mycobacteries 
appartenant audit complexe, en particulier la tuberculose, 

35 
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La presente invention a aussi pour but d'utiliser ces 
sequences (polypept idiques et polynucl6otidiques) comme 
5 cible pour la recherche de nouveaux inhibiteurs de la 
croissance et de la multiplication des mycobact^ries et de 
leur maintien chez 1'hote, ses inhibiteurs pouvant servir 
d' antibiotiques . 

It) Le genre Mycobacterium, qui comprend au moins 56 

especes diff£rentes, inclut des pathogenes humains majeurs 
tels gue M. leprae et M. tuberculosis, les agents 

responsables de la lepre et de la tuberculose, qui restent 
des problemes graves de sante publique dans le monde 
15 entier. 

La tuberculose continue d'etre un probleme de sant6 
publique dans le monde. Aujourd'hui, cette maladie est la 
cause de 2 a 3 millions de morts dans le monde et environ 8 
20 millions de nouveaux cas sont observes chaque annee 
(Bouvet, 1994) . Dans les pays developpes M. tuberculosis 

est la cause la plus commune des infections 
mycobacteriennes . En France il apparait environ 10 000 
nouveaux cas par an et parmi les maladies & declaration 
25 obligatoire c'est la tuberculose qui comprend le plus grand 
nombre de cas. La vaccination par le BCG (Bacille de 
Calmette et GuSrin) , une souche avirulente derivee de W. 

bovis et qui est tr§s utilisee comme vaccin contre la 
tuberculose, est loin d*etre efficace au sein de toutes les 
30 populations. Cette efficacite varie environ de 80 % dans 
les pays occidentaux comme 1 1 Angleterre, a 0 % en Inde 
(resultats du dernier essai de vaccination a Chingleput . , 
publies en 1972 dans Indian J. Med. Res.). De plus, 
1' apparition de souches de M. tuberculosis resistantes aux 
35 ant ituberculeux et le risque accru chez les patients 
immunodeprimes, patients atteints du SIDA, de developper 
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une tuberculose, rendent necessaire la mise au point de 
m6thodes rapides, specif iques et fiables pour le diagnostic 
de la tuberculose et la mise au point de nouveaux vaccins. 
Par exemple, une £tude 6pidemiologique realis<§e en Floride, 

5 et dont les r^sultats ont 6te publics en 1993 dans AIDS 
therapies, a montr6 que 10 % des malades atteints de SIDA 
sont atteints de tuberculose au moment du diagnostic du 
SIDA ou 18 mois avant celui-ci. Chez ces malades, la 
tuberculose apparait dans 60 % des cas sous une forme 

10 disseminee done non reperable par les critSres de 
diagnostic classiques comme la radiographic pulmonaire ou 
l 1 analyse de crachats. 

Actuellement , une certitude sur le diagnostic apporte 
15 par la mise en evidence de bacilles cultivables dans un 
prelevement provenant du malade n'est obtenue que pour 
moins de la moitie des cas de tuberculose, metre dans les 
cas de tuberculose pulmonaire. Le diagnostic de la 
tuberculose et des autres mycobacteries apparentees est 
20 done difficile a realiser, et cela pour differentes 
raisons : les mycobacteries sont souvent presentes en 
faible quantite, leur temps de generation est tres long 
(24h pour M . tuberculosis) et leur culture est difficile. 
(Bates et al . , 1986) . 

25 

D 1 autres techniques sont utilisables en clinique, pour 
identifier une infection mycobacterienne : 

a) L' identification directe des microorganismes au 
microscope ; cette technique est rapide, mais ne permet pas 
30 1 ■ identification de I'espSce mycobacterienne observee et 
manque de sensibilite (Bates, 1979) . 

Les cultures, lorsqu'elles sont positives, ont une 
specif icite approchant 100 % et permettent 1 ' identification 
de l'espece mycobacterienne isolde ; neanmoins, comme 
35 precise ci-dessus, la croissance des mycobacteries in vitro 
est longue (ne peut etre realisee qu'en 3 a 6 semaines de 
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cultures r6p6tees (Bates, 1979 ; Bates et al . , 1986)) et 
coQteuse. 

b) Les techniques sSrologiques peuvent s ! av6rer utiles 
5 dans certaines conditions, mais leur utilisation est 

parfois limit£e par leur sensibilite et/ou leur specificity 
faibles (Daniel et al . , 1987). 

c) La presence de mycobacttries au sein d'un 
10 echantillon biologique peut aussi etre determinee par 

hybridation moleculaire avec de I'ADN ou de l'ARN en 
utilisant des sondes d 1 oligonucleotides specif iques des 
sequences recherchees (Kiehn et al., 1987 ; Roberts et al., 
1987 ; Drake et al . , 1987). Plusieurs etudes ont montre 

15 l'interet de cette technique pour le diagnostic des 
infections a mycobacttries . Les sondes utilisees sont 
constitutes d'ADN, d'ARN ribosomique ou de fragments d'ADN 
mycobacteriens provenant de banque de genes. Le principe de 
ces techniques repose sur le polymorphisme des sequences 

20 nucleotidiques des fragments utilises ou sur le 
polymorphisme des regions avoisinantes . Dans tous les cas, 
elles necessitent 1 1 utilisation de cultures et ne sont pas 
applicables directement sur les echantillons biologiques. 

25 La faible quantite de mycobacteries presentes au sein 

d'un echantillon biologique et en consequence la quantite 
faible d'ADN cible a dStecter dans cet echantillon peut 
n§cessiter le recours a une amplification sp6cifique in 
vitro de I'ADN cible avant sa detection a l'aide de la 

30 sonde nucleotidique et en utilisant des techniques 
d» amplification in vitro telles que la PCR (amplification 
en chaine a la polymerase. L ! amplification specif ique de 
I'ADN par la technique PCR peut const ituer la premiere 
§tape d'un procede de detection de la presence d'un ADN 

35 mycobactSrien dans un echantillon biologique, la detection 
proprement. dite de 1 ' ADN amplifie etant effectuee dans un 
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second temps a l'aide d'une sonde oligonucleotidique 
capable de s'hybrider specif iquement £ l'ADN amplifie. 

Un test de detection de mycobacteries appartenant au 
complexe de Mycobacterium tuberculosis, par hybridation 

5 sandwich (test utilisant une sonde de capture et une sonde 
de detection) a £t£ decrit par Chevrier et al . en 1993. le 
complexe de Mycobacterium tuberculosis est un groupe de 

mycobacteries qui comprend M. bovis-BCG, M. Jbovis, M. 

tuberculosis, M. africanum et M. microti. 

10 

Un proc£de de detection de faibles quantit£s de 
mycobacteries, appartenant au complexe tuberculosis, par 
amplification genique et hybridation directement sur des 
€chantillons biologiques a 6te mis au point. Ledit procede 
15 utilise la sequence d* insertion IS6110 (Brevet europeen EP 

0 490 951 Bl) . Thierry et al. ont d£crit en 1990 une 
sequence specifique du complexe Mycobacterium tuberculosis 

et nommee IS 6110. Certains auteurs ont propose 
d 'amplifier specif iquement l'ADN provenant de 
20 Mycobacterium en utilisant des amorces nucleiques dans une 

methode d 1 amplification, telle que la reaction de 
polymerase en chaine (PCR) . Patel et al . ont d£crit en 1990 
1 'utilisation de plusieurs amorces nucleiques choisies a 
partir d'une sequence connue en tant que sonde dans 
25 1 1 identification de M. tuberculosis. Cependant, la longueur 

des fragments obtenus en utilisant ces amorces £tait 
differente de la longueur theorique attendue et plusieurs 
fragments de taille variable etaient obtenus. De plus, les 
auteurs ont observe 1' absence d' hybridation des produits 
30 amplifies avec le plasmide ayant servi a determiner les 
amorces. Ces r§sultats indiquent que ces amorces ne 
seraient pas appropriees dans la detection de la presence 
de M, tuberculosis dans un 6chantillon biologique et 

confirment la nature critique du choix des amorces. La meme 
35 annee, J..L. Guesdon et D. Thierry ont decrit une m6thode de 
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detection de M. tuberculosis, de grande sensibility, par 

amplification d'un fragment d'ADN de M. tuberculosis 

localise au sein de la sequence IS6110 (Brevet europ4en EP 
461 045) a l'aide d' amorces g6n6rant des fragments d'ADN 

5 amplifi6 de longueur constante, meme lorsque le choix des 
amorces conduisait a 1 ■ amplification de fragments longs (de 
l'ordre de 1000 a 1500 bases) oil le risque d ■ interruption 
de la polymerisation est 61ev6e en raison des effets de la 
structure secondaire de la sequence. D'autres amorces 

10 specifiques de la sequence IS6110 sont decrites dans le 
brevet europeen N° EP-0490 951. 

Les inventeurs ont montre (resultats non publies) que 
certains isolats cliniques de Mycobacterium tuberculosis 

15 6taient exempts de la sequence d' insertion IS6110 et ne 
pouvaient done etre detectes a l*aide des oligonucleotides 
specifiques de cette sequence pouvant conduire ainsi a des 
resultats de diagnostic faussement negatifs. Ces resultats 
confirment une observation similaire faite par Yuen et al . 

20 en 1993. L 1 impossibility de detecter ces souches pathogenes 
potent iellement presentes dans un echantillon biologique 
preleve sur un patient est ainsi susceptible de conduire & 
des difficultes voire des erreurs de diagnostic. La 
disponibilite de plusieurs sequences specifiques du Bacille 

25 de la tuberculose, a l'interieur desquelles des amorces 
appropriees pour 1 1 amplification seront choisis, est 
importante. La sequence DP428 decrite ici pourra etre 
utilisee . 

30 M. bovis et M. tuberculosis, les agents causals de la 

tuberculose, sont des bacteries facultatives intra- 
cellulaires . 

Ces agents ont developp£ des mecanismes pour assurer 
35 leur survie et leur replication a 1 1 interieur du 
macrophage, un des types cellulaires qui est suppose 
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gradiquer 1' invasion par des microorganismes . Ces agents 
sont capables de moduler 1* evolution normale de leur 
phagosome et de les empecher de se dif ferencier en un 
compartiment acide riche en hydrolase (Clemens, 1979 ; 

5 Clemens et al. ( 1996; Sturgill-Koszycki et al., 1994 et Xu 
et al., 1994). Cependant, cette modulation n'est possible 
que si la bact6rie est vivante au sein du phagosome, 
sugg6rant que des composes synth6tis§s de maniere active 
et/ou s6cr6t£s a 1'intSrieur de la cellule font partie de 

to ce mecanisme. Des proteines exportees sont probablemenc 
impliquees dans ce mecanisme. En depit des problemes 
majeurs de sante lies a ces organismes pathogenes, on sait 
peu de choses sur leurs proteines exportees et/ou 
secretees. Des analyses en SDS-PAGE de filtrat de culture 

15 de M. tuberculosis montrent au moins 30 proteines secretees 

(Altschul et al., 1990 ; Nagal et al., 1991 et Young et 
al . , 1992). Certaines d'entre elles ont ete caracterisees, 
leurs genes clones et sequences (Borremans et al . , 1989 ; 
Wiker et al . , 1992 et Yamaguchi et al . , 1989). D'autres, 

20 bien qu'il s'agisse d'antigenes immunodominants 
d' importance majeure pour induire une immunite protectrice 
(Anderson et al.,1991 et Orme et al . , 1993), ne sont pas 
totalement identifies. En outre, il est probable que de 
nombreuses proteines exportees restent fixees sur la 

25 membrane cellulaire et par consequent ne soient pas 
prfisentes dans les surnageants de culture, II a £t§ montrS 
que les proteines localisees a la surface externe de 
diverses bacteries pathogenes, telles que l'invasine de 103 
kDa de Yersina Pseudotuberculosis (Isberg et al . , 1987) ou 

30 1 ■ internaline de 80 kDa de Listeria monocytoqenes (Gaillard 

et al., 1991 et Dramsi et al., 1997) jouent un role 
important dans les interactions avec les cellules hotes et 
par consequent, dans la pathogenicite comme dans 
l 1 induction de reponses protectrices . Ainsi, une proteine 
35 li£e a la membrane pourrait Stre importante pour 
1' infection a M. tuberculosis comme pour 1' induction de 
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reponse protectrice centre cette infection. Ces proteines 
pourraient revetir un interet certain pour la preparation 
de vaccins. 

5 R6cemment, il a 6t£ decrit 1' adaptation aux 

mycobact^ries d'une m£thodologie g6n6tique pour 
1 1 identification et la selection ph£notypique de protSines 
export^es (Lim et al. , 1995). Cette methode utilise la 
phosphatase alkaline (PhoA) p6riplasmique d'E. coli. Un 

10 vecteur plasmidique a ete construit permettant la fusion de 
genes entre un gene PhoA tronque et des genes codant pour 

des proteines exportees (Manoil et al . , 1990). 

Par cette methode, il a pu etre identifi£ un gene 
15 de M, tuberculosis (erp (Berthet et al., 1995)) presentant 
des homologies avec une proteine exportee de 28 kDa de M. 
leprae, qui est une cible frequente des reponses humorales 

de la forme lepromateuse de la lepre. Une proteine 
presentant des motifs aminoacides caracteristiques de la 
20 desaturase de plante (des) a aussi €te caracterisee par la 
technique de fusion avec PhoA. 

Cependant, cette methode genetique d' identification 
de proteines export€es ne permet pas d'Svaluer facilement 

25 1' expression intracellulaire des genes correspondants . Une 
telle evaluation est d'une importance primordiale a la fois 
pour la selection de bons candidate vaccins et pour la 
comprehension des interactions entre les bactiries et leurs 
cellules hotes. L 1 induction de 1' expression de facteur de 

30 virulence par contact de cellule cible pathogene a ete 
decrite. C'est le cas par exemple pour les facteurs de 
virulence Yops (Petersson et al . , 1996) de Yersinia 
pseudotuberculosis. Shigella par contact avec les cellules 
cibles relargue les proteines Ipa dans le milieu de 

35 culture, .et Salmonella synthetise de nouvelles structures 
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de surface. 

Compte tenu de ce qui precede, il existe aujourd*hui 
un grand besoin de developper de nouveaux vaccins contre 

5 les mycobact6ries pathogenes ainsi que de nouveaux testa de 
diagnostic specif iques, fiables et rapides. Ces 
dSveloppements n^cessitent la mise au point d'outils 
specif iques encore plus performants permettant, d'une part, 
d'isoler ou d'obtenir des sequences de nouveaux 

10 polypeptides specif iques, notamment immunogenes, et, 
d' autre part, de mieux comprendre le mecanisme des 
interactions entre les bacteries et leurs cellules hotes 
comme notamment 1' induction de 1' expression de facteur de 
virulence . Ceci est precisement l'objet de la presente 

15 invention. 

Les inventeurs ont defini et realise dans ce but de 
nouveaux vecteurs permettant le criblage, le clonage et/ou 
1* expression de sequences d'ADN de mycobacteries afin 

20 d' identifier parmi ces sequences, des acides nucleiques 
codant pour des proteines d'interet, de preference des 
proteines export€es, pouvant etre localisees sur la 
membrane bacterienne et/ou secretees, et d' identifier parmi 
ces sequences celles qui sont induites ou reprimSes lors de 

25 1* infection (croissance intracellulaire) . 

Description 

La prSsente invention decrit 1 ' utilisation du gene 
30 rapporteur phoA chez les mycobacteries. II permet 
d ! identifier des systemes d' expression et d 1 exportation 
dans un contexte mycobacterien. Beaucoup de genes ne sont 
exprimSs que dans un tel contexte, ce qui montre 1 • avantage 
de la presente invention. Au cours du clonage de segments 
35 d'ADN de souches du complexe M. Tuberculosis en fusion avec 
phoA dans - une autre mycobacterie comme M. smegmatis, le 
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d£but du gene, ses regions regulatrices et son regulateur 
seront clones ce qui permettra d* observer une regulation. 
Si cette regulation est positive, le clonage du regulateur 
constituera un avantage pour observer 1' expression et 
5 1 ' exportation . 

Dans le contexte de 1* invention, on entend par 
mycobact6rie toutes les mycobacteries appartenant aux 
diverses especes enum€r£es par Wayne L. G. and Kubica G. P. 
10 (1980) . Family Mycobacteriaceae in Bergey's manual of 
systematic bacteriology, J. P. Butler Ed. (Baltimore USA : 
Williams et Wilkins P. 1436-1457) . 

Dans certains cas les genes clones sont soumis dans 
15 leur h6te d'origine a une regulation negative rendant 
1 •observation de 1' expression et de 1 ■ exportation difficile 
chez l'hote d'origine. Dans ce cas, le clonage du gene en 
absence de son regulateur negatif, dans un hote ne le 
contenant pas, constituera un avantage. 

20 

L' invention vise aussi de nouveaux polypeptides et de 
nouveaux polynucleotides de mycobacteries ayant pu etre 
isol£s au moyen des vecteurs precedents et susceptibles 
d'entrer dans la realisation de compositions pour la 
25 detection d'une infection par des mycobacteries, ou pour la 
protection cohtre une infection due a des mycobatSries ou 
pour la recherche d ■ inhibiteurs comme cela est decrit 
pr6c£demment pour DP428. 

30 

L ' invention a done pour objet un vecteur recombinant 
de criblage, de clonage et/ou d ' expression, caract6rise en 
ce qu ! il se replique chez des mycobacteries et en ce qu'il 
contient : 

35 

1) un r§plicon fonctionnel chez les mycobacteries ; 

2) un marqueur de selection ; 
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3) une cassette rapporteur comprenant : 

a) un site de clonage multiple (polylinker) , 

b) £ventuellement un terminateur de transcription 
5 actif chez les mycobact6ries, en amont du polylinker, 

c) une sequence nucleotidique codante issue d'un gene 
codant pour un marqueur d ' expression, d ' exportation et/ou 
de secretion de proteine, ladite sequence nucleotidique 
etant d£pourvue de son codon d' initiation et de ses 

10 sequences de regulation, et 

d) une sequence nucleotidique codante issue d'un gene 
codant pour un marqueur d'activite de promoteurs contenus 
dans le meme fragment, ladite sequence nucleotidique etant 
pourvue de son codon d ' initiation . Eventuellement , le 

15 vecteur recombinant contient egalement un replicon 
fonctionnel chez E. coli. 

De maniere pr6f6ree, le marqueur d ' exportation et/ou 
de secretion est place dans la meme orientation que le 
20 marqueur d'activite de promoteurs. 

Pr6f erentiellement , le vecteur recombinant de criblage 
selon 1* invention comprendra, en outre, un terminateur de 
transcription plac£ en aval du marqueur d'activite de 
25 promoteurs, ce qui est de nature a permettre l'obtention de 
transcrits courts qui se rSvelent plus stables et qui, par 
consequent, permettent un plus haut niveau d' expression des 
produits de traduction. 

30 Le marqueur d ■ exportation et/ou de secretion est une 

sequence de nucleotides dont 1' expression suivie de 
1 1 exportation et/ou de la secretion depend des elements de 
regulation qui controlent son expression. 

35 Par "sequences ou elements de regulation de 

l 1 expression de la production de polypeptides et de sa 
localisation", on entend une sequence promotrice de la 
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transcription, une sequence comprenant le site de liaison 
au ribosome (RBS) , les sequences responsables de 
1 1 exportation et/ou la secretion telles que la sequence 
dite sequence signal. 

5 

Un premier marqueur int^ressant d 1 exportation et/ou 
d' expression est une sequence codante issue du g6ne phoA. 

Le cas 6ch6ant, elle est tronquee de telle fa^on que 
I'activite phosphatase alcaline est cependant susceptible 
10 d'etre restauree lorsque la sequence codante tronquee est 
placee sous le controle d'un promoteur et d 1 elements de 
regulation appropriSs. 

D'autres marqueurs d'exposition, d ' exportation et/ou 
15 de secretion peuvent etre utilises. On citera a titre 
d'exemples une sequence du gene P-agarase, de la nuclease 
d'un staphylocoque ou d'une P- lactamase. 

Parmi les marqueurs interessants d'activite de 
20 promoteurs contenus dans le meme fragment, on prefere une 
sequence codante issue du gene luc de luciferase de luciole 

pourvue de son codon d ! initiation . 

D'autres marqueurs d'activite de promoteurs contenus 
25 dans le meme fragment peuvent etre utilises. On citera a 
titre d'exemples une sequence du gene de la GFP (Green 
Fluorescent Protein) . 

Le terminateur de transcription doit etre fonctionnel 
30 chez les mycobacterias . Un terminateur avantageux est a cet 
6gard le terminateur du coliphage T4 (tT4) . D'autres 
terminateurs appropries pour la realisation de 1' invention 
peuvent §tre isoles en utilisant la technique presentee 
dans les exemples, par exemple au moyen d'une cassette 
35 "omega" (Prentki et al . , 1984). 
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Un vecteur particulierement prefers pour la 
realisation de 1' invention est un plasmide choisi parmi les 
plasmides suivants deposes a la CNCM (Collection Nationale 
de Cultures de Microorganismes , 25 rue de Docteur Roux, 
5 75724 Paris cedex 15, France) : 

a) pJVEDa depose a la CNCM sous le N° 1-1797, le 12/12 

1996, 

b) pJVEDb depos6 a la CNCM sous le N° 1-1906, le 25 
10 juillet 1997, 

c) pJVEDc depose a la CNCM sous le N° 1-1799 , le 
12/12 1996. 

Pour la selection, ou 1 ' identification de sequences 
15 d'acides nucleiques de mycobacteries codant pour des 
polypeptides susceptibles d'etre incorpores dans des 
compositions immunogenes, ou antigeniques pour la detection 
d'une infection, ou susceptibles d'induire ou de reprimer 
un facteur de virulence de mycobacteries, le vecteur de 
20 1' invention comprendra, en l'un des sites de clonage 
multiple du polylinker, une sequence de nucleotides d'une 
mycobacterie chez laquelle on detecte la presence de 
sequences correspondant a des polypeptides exportes et/ou 
secretes pouvant etre induits ou reprimes lors de 
25 1* infection, ou encore exprim^s ou produits de fa<;on 
constitutive, leurs sequences promotrices et/ou 
r£gulatrices associees susceptibles de permettre ou de 
favoriser 1 ' exportation et/ou la secretion desdits 
polypeptides d'int£ret, ou tout ou partie de genes 
30 d ! interet codant pour lesdits polypeptides. 

De preference, cette sequence est obtenue par 
fragmentation physique ou par digestion enzymatique de 
1 ' ADN genomique ou de 1 ' ADN complementaire d ' un ARN d 1 une 
35 mycobacterie, de preference M. tuberculosis ou choisie 

parmi M. africanum, M. bovis, M. avium ou M. leprae. 
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Les vecteurs de 1' invention peuvent en effet egalemerit 
etre utilises pour determiner la presence de sequences 
d'int£ret, de preference correspondant a des proteines 
exportees et/ou sScr^tees, et/ou capables d'etre induites 
5 ou r§prim6es ou produites de fagon constitutive lors de 
1" infection, notamment lors de la phagocytose par les 
macrophages, et selon ce qui a ete expose pr6c£demment , 
chez des mycobacteries telles que M. africanum, M. bovis, 

M. avium ou M. leprae dont on aura traite l'ADN ou l'ADNc 

10 par fragmentation physique ou avec des enzymes determines. 

Selon un premier mode de realisation de 1' invention la 
digestion enzymatique de l'ADN genomique ou de l'ADN 
complementaire est effectuee a partir de M. tuberculosis . 

15 De preference cet ADN est digere avec une enzyme telle 

que sau3A, BclI,BglII. 

D'autres enzymes de digestion telles que Seal, Apal, 
SacII, Kpnl ou encore des nucleases ou des polymerases, 
20 peuvent naturellement etre mises en oeuvre, des lors 
qu'elles permettent I'obtention de fragments dont les 
extremites peuvent etre inserees dans l'un des sites de 
clonage du polylinker du vecteur de 1* invention. 

Le cas ech£ant, des digestions avec differentes 
25 enzymes seront effectuees simultanement . 

Des vecteurs recombinants pr£fer6s pour la realisation 
de 1* invention sont choisis parmi les vecteurs recombinants 
suivants deposes a la CNCM : 
30 a) p6D7 depose le 28 janvier 1997 a la CNCM sous le N°I- 
1814, 

b) p5A3 depose le 28 janvier 1997 a la CNCM sous le N°I- 
1815, 

c) p5F6 depos€ le 28 janvier 1997 a la CNCM sous le N°I- 
35 1816, 

d) p2A29 depose le 28 janvier 1997 & la CNCM sous le N°I- 
1817, 
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e) pDP428 depose le 28 janvier 1997 a la CNCM sous le N°I- 
1818 , 

f) p5B5 depose le 28 janvier 1997 a la CNCM sous le N°I- 
5 1819, / 

g) plC7 depose le 28 janvier 1997 a la CNCM sous le N°I- 
1820, 

h) p2D7 dSposS le 28 janvier 1997 a la CNCM sous le N°I- 
1821, 

10 i) plB7 depose le 31 janvier 1997 a la CNCM sous le N°I- 
1843, 

j) pJVED/M. tuberculosis depose le 25 juillet 1997 a la 

CNCM sous le N° 1-1907, 
k) pM!C25 depose le 4 aoQt 1998 a la CNCM sous le n°I-2062. 



15 



20 



35 



Parmi les plus preferes, on prefere le vecteur 
recombinant pDP428 depose le 28 janvier 1997 a la CNCM sous 
le N°I-1818, et le vecteur pMlC25 depose le 4 aout 1998 a 
la CNCM sous le N° 1-2062. 



L ! invention a egalement pour objet un procede de 
criblage de sequences de nucleotides issues de 
mycobacteries pour determiner la presence de sequences 
correspondant a des polypeptides exportes et/ou secretes 

25 pouvant etre induits ou r£primes lors de 1' infection, leurs 
sequences promotrices et/ou regulatrices associ§es 

susceptibles notamment de permettre ou de favoriser 
1 1 exportation et/ou la secretion desdits polypeptides 
d'interet, ou tout ou partie de genes d'interet codant pour 

30 lesdits polypeptides, caracterise en ce qu'il met en oeuvre 
un vecteur recombinant selon 1' invention. 

L' invention concerne aussi un proced6 de criblage, 
selon 1 ! invention, caracterise en ce qu'il comprend les 
Stapes suivantes : 



a) la fragmentation physique des sequences d'ADN de 
mycobacteries ou leur digestion par au moins une enzyme 
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determine et la recuperation des fragments obtenus ; 

b) I 1 insertion des fragments obtenus a l'6tape a) dans 
un site de clonage, compatible le cas 6ch6ant avec 1' enzyme 
de l'etape a), du polylinker d'un vecteur seion 

5 1' invention ; 

c) si besoin, 1 1 amplification desdits fragments 
contenus dans le vecteur, par exemple par replication de ce 
dernier apres insertion du vecteur ainsi modifi6 dans une 
cellule determinee, de preference £ coli ; 

K) d) la transformation des cellules hotes par le vecteur 

amplifie a l'Stape c) , ou en 1 1 absence d' amplification, par 
le vecteur de l'etape b) ; 

e) la culture des cellules botes transf ormees dans un 
milieu permettant la mise en evidence du marqueur 

15 d ' exportation et/ou de secretion, et /ou du marqueur 
d' activity de promoteurs contenu dans le vecteur ; 

f) la detection des cellules hotes positives (colonies 
positives) pour 1* expression du marqueur d * exportation 
et/ou de secretion, et /ou du marqueur d'activite de 

20 promoteurs ; 

g) l'isolement de 1 1 ADN des colonies positives et 
1* insertion de cet ADN dans une cellule identique a celle 
de 1' St ape c) ; 

h) la selection des insertions contenues dans le 
25 vecteur, permettant l'obtention de clones positifs pour le 

marqueur d' exportation et/ou de secretion, et /ou pour le 
marqueur d 1 activity de promoteurs ; 

i) l'isolement et la caracterisation des fragments 
d'ADN de mycobacteries contenues dans ces inserats. 

30 

Dans l'un des modes de realisation pref£r€s du procSde 
de criblage selon 1» invention, les cellules hotes 
positives, d£tect£es a l'etape f ) ( pour le marqueur 
d ' exportation et/ou de secretion sont, eventuellement dans 
35 un second temps, test£es pour la capacity de 1 1 insert 
nucleotidique selectionne a stimuler 1' expression du 
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marqueur d'activite de promoteurs lorsque lesdites cellules 
hotes sont phagocyt^es par des cellules du type 
macrophagique . 

5 De maniere plus specif ique, on compare la stimulation 

de 1' expression du marqueur d 1 activity de promoteurs chez 
des cellules hotes plac6es en culture axSnique (cellules 
hotes seules en culture) S la stimulation de 1 ! expression 
du marqueur d ! activity de promoteurs chez des cellules 

10 hotes cultivSes en presence de macrophages et ainsi 
phagocytees par ces derniers. 

La selection de cellules hotes positives pour le 
marqueur d'activite de promoteurs peut etre realisee des 
15 l'etape e) du procede de criblage decrit ci-dessus, ou 
encore apres 1'une quelconque des 6tapes f ) , g) , h) ou i) , 
c'est-a-dire une fois que les cellules hotes ont 6te 
select ionnSes positivement pour le marqueur d ' exportation 
et/ou de selection. 

20 

La mise en oeuvre de ce procede permet la construction 
de banques d'ADN comportant des sequences correspondant a 
des polypeptides susceptibles d'etre exportes et/ou 
secretes, et/ou susceptibles d'etre induits ou reprim^s 
25 lors de 1' infection lorsqu'ils sont produits au sein de 
mycobact§ries " recombinantes. L'Stape i) du procSde peut 
comprendre une etape de s^quengage des insertions 
s61ectionn§es . 

30 De preference, dans le procede selon 1' invention, le 

vecteur utilise est choisi parmi les plasmides pJVEDa 
(CNCM, N° 1-1797) ,pJVEDb (CNCM, N° 1-1906), pJVEDc (CNCM, 
N° 1-1799) ou pJVED/M, tuberculosis (CNCM, N°I-1907) , et la 

digestion des sequences d'ADN de mycobacteries est 
35 effectuee au moyen de 1' enzyme Sau3A. 



Seloriun mode de realisation prefere de 1' invention, 
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le proc§de de criblage est caract6ris§ en ce que les 
sequences de mycobacteries sont issues d'une mycobacterie 
pathogene, par exemple de M. tuberculosis, M. bovis, M. 
avium, M. africanuin ou W. leprae. 

5 

L' invention comprend Sgalement une banque d'ADN 
gSnomique ou d'ADNc complfimentaire d'ARNm de mycobacterie , 
caracterisee en ce qu'elle est obtenue par un procede 
comprenant les Stapes a)et b) , ou a), b) et c) du procede 
10 precedent selon 1' invention, de preference une banque d'ADN 
gfenomique ou d'ADNc complementaire d'ARNm de mycobacteries 
pathogenes, de preference de mycobacteries appartenant au 
groupe du complexe Mycobacterium tuberculosis t de 

preference de Mycobacterium tuberculosis . 

15 

Dans la pr£sente invention, on entend designer par 
"sequences nucleiques" ou "sequences d'acides amines" SEQ 
ID N° X a SEQ ID N° Y, o0 X et Y peuvent representer 
independamment un nombre ou un caractere alphanumerique, 
20 respectivement 1' ensemble des sequences nucleiques ou 
1* ensemble des sequences d'acides amines representees par 
les figures X a Y, extremites comprises. 

Par exemple, les sequences nucleiques ou les sequences 
25 d'acides amines SEQ ID N° 1 a SEQ ID N° 4N sont 
respectivement les sequences nucleiques ou les sequences 
d'acides amines representees par les figures 1 a 4N, c'est- 
a-dire respectivement les sequences nucleiques ou les 
sequences d'acides amines SEQ ID N° 1, SEQ ID N° 1A* , SEQ 
30 ID N° IB', SEQ ID N° 1C, SEQ ID N° ID, SEQ ID N° IF, SEQ 
ID N° 2, SEQ ID N° 3A, SEQ ID N° 3B, SEQ ID N° 3C, SEQ ID 
N° 4A, SEQ ID N° 4B, SEQ ID N° 4C, SEQ ID N° 4A\ SEQ ID N° 
4B», SEQ ID N° 4C, SEQ ID N° 4F, SEQ ID N° 4J, SEQ ID N° 
4K, SEQ ID N° 4L, SEQ ID N° 4M et SEQ ID N° 4N. 

35 

L' invention a egalement pour objet les sequences 
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nucleotidiques de mycobact£ries ou comprenant des sequences 
nucleotidiques de mycobact6ries s£lectionn€es apres la 
realisation du proc£d6 selon 1' invention ci-dessus decrit. 

5 

De preference, ladite mycobact£rie est choisie parmi M. 
tuberculosis, M. bovis, M. africanum, M . avium, M. leprae, 
M. paratuberculosis, M. kansassi ou M. xfenopi . 

10 On pr£fere les sequences nucleotidiques de mycobacteries 

ou comprenant une sequence nucl£ot idique de mycobact^rie , 
ladite sequence nucleotidique de mycobacterie £tant choisie 
parmi les sequences de fragments d'ADN de mycobacterie de 
sequence nucleique SEQ ID N° 1 a SEQ ID N° 24C, SEQ ID N° 

15 27A a SEQ ID N° 27C, SEQ ID N° 29 et SEQ ID N° 31A k SEQ ID 
N° 50F, respect ivement representees par les figures 1 £ 24C 
(planches 1 a 150) , par les figures 27A a 27C (planches 152 
a 154) , par la figure 29 (planche 156) et par les figures 
31A a 50F (planches 158 a 275) . 

20 

Selon un mode de realisation particulier de 1' invention, 
des sequences pr€f6rees sont par exemple les fragments 
d'ADN de mycobacteries de sequence SEQ ID N°l, SEQ ID N°3A, 
SEQ ID N°5A, SEQ ID N°6A, SEQ ID N°7A, SEQ ID N°8A, SEQ ID 

25 N°9A, SEQ ID N°10A, SEQ ID N°27A ou SEQ ID N°29 contenus 
respect ivement dans les vecteurs pDP428 (CNCM, N°I-1818) , 
v p6D7 (CNCM, N°I-1814), p5F6 (CNCM, N°I-1816) # p2A29 (CNCM, 
N°I-1817), p5B5 (CNCM, N°I-1819) , plC7 (CNCM, N°I-1820) , 
p2D7 (CNCM,N°I-1821) , plB7(CNCM, N°I-1843) , p5A3 (CNCM, 

30 N°I-1B15) et pMlC25 (CNCM, n°I-2062) . 

L' invention concerne egalement un acide nucleique 
comprenant la totalite de la phase de lecture ouverte d'une 
des sequences nucleotidiques selon 1* invention, notamment 
35 une des sequences SEQ ID N 6 1 i SEQ ID N° 24C, SEQ ID N° 
27A & SEQ ID N° 27C, SEQ ID N° 29 et SEQ ID N° 31A & SEQ ID 
N° 50F selon 1' invention. Ledit acide nucleique peut etre 
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isole par exemple de la fa<?on suivante : 

a) preparation d'une banque de cosmides a partir de I'ADN 
de M. tuberculosis , par exemple selon la technique d6crite 
par Jacobs et al., 1991; 

b) hybridation de tout ou partie d'un acide nucl^ique 
sonde de sequence choisie par exemple parmi SEQ ID N° 1 a 
SEQ ID N° 24C, SEQ ID N° 27A A SEQ ID N° 27C, SEQ ID N° 29 
et SEQ ID N° 31A h SEQ ID N° 50F avec les cosmides de la 

10 banque pr6alablement preparee a l ! 6tape a) ; 

c) selection des cosmides hybridant avec 1' acide 
nucleique sonde de 1'Stape b) ; 

d) sequentjage des inserts d'ADN des clones select ionnes a 
l'Stape c) et identification du cadre de lecture ouvert 

15 complet ; 

e) le cas echeant, clonage des inserts sequences a 
l'etape d) dans un vecteur d' expression et/ou de clonage 
approprie . 

20 Les acides nucleiques comprenant la totalite du cadre de 

lecture ouvert des sequences SEQ ID N° 1 a SEQ ID N° 24C, 
SEQ ID N° 27A h SEQ ID N° 27C, SEQ ID N° 29 et SEQ ID N° 
31A i SEQ ID N° 50F sont parmi les acides nucleiques 
pr§f6res , 

25 

La prSsente invention permet de determiner un fragment 
de gene codant pour un polypeptide exporte. La comparaison 
avec la sequence du genome publi£e par Cole et al . (Cole et 
al., 1998, Nature, 393, 537-544) permet de determiner le 
30 gene en entier portant la sequence identifiie selon la 
presente invention. 

Par sequence nucleotidique comprenant la totalite du 
cadre ouvert de lecture d'une sequence selon 1' invention, 
35 on entend la sequence nucleotidique (genomique, ADNc, semi- 
synthetique ou synthetique) comprenant l'une des sequences 
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selon 1' invention et s'etendant d'une part en 5 ' de ces 
sequences jusqu'au premier codon d' initiation de la 
traduction (ATG ou GTG) ou meme jusqu'au premier codon 
stop, et d* autre part en 3 1 de ces sequences jusqu'au codon 
5 stop suivant, et ceci dans l'une quelconque des trois 
phases de lecture possibles. 

Les sequences nucl6otidiques compiementaires des 
sequences ci-dessus selon l 1 invention font egalement partie 
10 de 1' invention. 

Par polynucleotide de sequence complementaire d'une 

sequence nucleotidique selon 1' invention, on entend toute 

sequence d'ADN ou d'ARN dont les nucleotides sont 

15 compiementaires de ceux de ladite sequence selon 
1* invention et dont 1 ' orientation est invers£e. 

Les fragments nucleotidiques des sequences ci-dessus 
selon 1' invention notamment utiles en tant que sondes ou 
20 amorces font egalement partie de 1* invention. 

L' invention concerne aussi les polynucleotides 
caracterises en ce qu'ils comprennent un polynucleotide 
choisi parmi : 

25 a) un polynucleotide dont la sequence est complementaire de 
la sequence d'un polynucleotide selon 1' invention, 

b) un polynucleotide dont la sequence comporte au moins 50% 
d 1 identity avec un polynucleotide selon 1' invention, 

c) un polynucleotide hybridant dans des conditions de forte 
30 stringence avec une sequence de polynucleotide selon 

1 * invention, 

d) un fragment d'au moins 8 nucleotides consecutifs d'un 
polynucleotide defini selon 1' invention. 

35 Les conditions de forte stringence ainsi que le 

pourcentage d'identite seront d£finis ci-apres dans la 
presente description. 
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Lorsque la sequence codante issue du gdne marqueur 
d' exportation et/ou de secretion est une sequence issue du 
gene phoA, 1 ■ exportation et/ou la secretion du produit du 

5 gdne phoA, le cas 6ch6ant tronque, n'est obtenue que 
lorsque cette sequence est ins6r£e en phase avec la 
sequence ou element de regulation de 1' expression de la 
production de polynucleotides et sa localisation plac6e en 
amont, qui contient les Elements controlant 1 ' expression, 

10 1 ' exportation et/ou la secretion issus de sequence de 
mycobacteries . 

Les vecteurs recombinants de 1' invention peuvent bien 
entendu comprendre des sites de clonage multiples decalSs 
15 de un ou deux nucleotides par rapport a un vecteur selon 
1' invention, permettant ainsi d'exprimer le polypeptide 
correspondant au fragment d'ADN de mycobacterie insure et 
susceptible d'etre traduit selon l'un des trois cadres de 
lecture possibles. 

20 

Par exemple les vecteurs prSferes pJVEDb et pJVEDc de 
1' invention se distinguent du vecteur pr^fere pJVEDa par un 
dScalage respect if de un et de deux nucleotides au niveau 
25 du site de clonage multiple. 

Ainsi, les vecteurs de 1' invention sont capables 
d'exprimer chacun des polypeptides susceptibles d'etre 
codes par un fragment d'ADN de mycobacterie ins6re . Cesdits 
30 polypeptides, caracterises en ce qu'ils sont done 
susceptibles d'etre exportes et/ou secretes, et/ou induits 
ou reprimes, ou exprimes de faqon constitutive lors de 
1' infection, font partie de 1' invention. 

35 On prefere notamment les polypeptides de l 1 invention 

dont les sequences d'acides amines sont choisies parmi les 
sequences d'acides amines SEQ ID N° la SEQ ID N° 24C, SEQ 



WO 99/09186 



PCTVFR98/01813 



23 

ID N° 27A a SEQ ID N° 28 et SEQ ID N° 30 a SEQ ID N° 50F et 
representees respect ivement par les figures 1 a 24C 
(planches 1 a 150) , les figures 27A a 28 (planches 152 a 
155) et les figures 30 a 50F (planches 157 a 275) . 

5 

Font 6galement partie de 1' invention, les fragments ou 
fragments biologiquement actifs ainsi que les polypeptides 
homologues desdits polypeptides. Fragment, fragment 
biologiquement actif et polypeptides homologue de 
10 polypeptide, £tant tels que d£finis ci-apres dans la 
description. 

L' invention concerne egalement les polypeptides 
comprenant un polypeptide ou un de leurs fragments selon 
15 1' invention. 

L' invention a aussi pour objet des mycobact£ries 
recombinantes contenant un vecteur recombinant selon 
l 1 invention decrit precedemment . Une mycobacterie preferee 
20 est une mycobacterie du type M. smeqmatis . 

M. smeqmatis permet avantageusement de tester 
l'efficacite de sequences de mycobacteries, pour le 
controle de 1 • expression, de 1 * exportation et/ou de la 
secretion, et/ou de l'activite de promoteurs d'une sequence 
25 donnee, par exemple d'une sequence codant pour un marqueur 
tel que la phosphatase alcaline et/ou la lucif erase. 

Une autre mycobacterie preferee est une mycobacterie du 
type M. bovis, par exemple la souche BCG utilisee 
30 actuellement pour la vaccination contre la tuberculose. 

Une autre mycobacterie preferee est une souche de M. 
tuberculosis, M. bovis ou H. africanum possedant 
potentiellement tous les syst£mes de regulation appropries. 

35 Les inventeurs ont ainsi caract£rise en particulier un 

polynucleotide constitue par une sequence de nucleotides 
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presente chez toutes les souches testees de mycobact6ries 
appartenant au complexe de Mycobacterium tuberculosis . Ce 
polynucleotide, d6nomme DP428 contient un cadre ouvert de 

lecture (ORF) codant pour un polypeptide d' environ 12 kD. 
5 Le cadre de lecture ouvert (ORF) codant pour le polypeptide 

DP428 s'6tend du nucleotide en position nt 941 au 

nucleotide en position nt 1351 de la sequence SEQ ID N° 2, 

le polypeptide DP428 ayant la sequence en acides amines SEQ 

ID N° 28 suivante : 
10 MKTGTATTRRRLLAVLIALALPGAAVALLAEPSATGASDPCAASEVARTVGSVAKSMGD 

YLDSHPETNQVMTAVLQQQVGPGSVASLKAHFEANPKVASDLHALSQPLTDLSTRCSLP 

I SGLQAIGLMQAVQGARR . 

Ce poids moleculaire ( PM) correspond au PM theorique de 
15 la proteine mature obtenue apres clivage de la sequence 
signale, le PM de la proteine ou polypeptide DP428 etant 
d 1 environ 10 kD apres ancrage potent iel au peptidoglycane 
et coupure potentielle entre S et G du motif LPISG. 

20 Ce polynucleotide inclut, d'une part, un cadre ouvert de 

lecture correspondant a un gene de structure et, d' autre 
part, les signaux de regulation de 1' expression de la 
sequence codante en amont et en aval de cette derniere.Le 
polypeptide DP428 est compose d'un peptide signal, d'une 

25 region centrale hydrophile et d'une region C-terminale 
hydrophobe. Cette derniere se termine par deux residus 
arginines (R) , signal de retention, et est precede par un 
motif LPISG qui rappelle le motif LPXTG d'ancrage au 
peptidoglycane (Schneewind et al . , 1995). 

30 

Par gSne de structure aux fins de la presente invention, 
on entend un polynucleotide codant pour une proteine, un 
polypeptide ou encore un fragment de ces derniers, ledit 
polynucleotide ne comprenant que la sequence correspondant 
35 au cadre ouvert de lecture (ORF) , ce qui exclut les 
sequences du cote 5' du cadre ouvert de lecture (ORF) qui 
dirigent 1' initiation de la transcription. 
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Ainsi, l 1 invention concerne en particulier un 
polynucleotide dont la sequence est choisie parmi les 
sequences nucieotidiques SEQ ID N°l S SEQ ID N°2. 

5 

Plus particulidrement , 1' invention concerne un 
polynucleotide caracterise en ce qu'il comprend un 
polynucleotide choisi parmi : 

10 a) un polynucleotide dont la sequence est choisie parmi les 
sequences nucieotidiques SEQ ID N°l a SEQ ID N°2, 

b) un polynucleotide dont la sequence nucieique est la 
sequence comprise entre le nucleotide en position nt 964 
et le nucleotide en position nt 1234, extremites indues, 

15 de la sequence SEQ ID N°l, 

c) un polynucleotide dont la sequence est compiementaire de 
la sequence d'un polynucleotide defini en a) ou b) , 

d) un polynucleotide dont la sequence comporte au moins 50% 
d'identite avec un polynucleotide defini en a), b) ou c) , 

20 e) un polynucleotide hybridant dans des conditions de forte 
stringence avec une sequence de polynucleotide defini en 
a) , b) ,c) ou d) , 

f) un fragment d'au moins 8 nucleotides consecutifs d'un 
polynucleotide defini en a), b) , c) , d)ou e) . 

25 

On entend par sequence nucieotidique, polynucleotide 
ou acide nucieique, selon la presente invention, aussi bien 
un ADN double brin, un ADN simple brin que des produits de 
transcription desdits ADN . 

30 

Par pourcentage d'identite au sens de la presente 
invention, on entend un pourcentage d ! identite entre les 
bases de deux polynucleotides, ce pourcentage etant 
purement statistique et les differences entre les deux 
35 polynucleotides etant reparties au hasard et sur toute 
leur longueur. 
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Une hybridation dans des conditions de forte 
stringence signifie que les conditions de temperature et de 
force ionique sont choisies de telle maniere qu'elles 
permettent le maintien de 1 1 hybridation entre deux 
5 fragments d'ADN compiementaires . 



A titre illustratif, des conditions de forte 
stringence de l'fitape d ' hybridation aux fins de dSfinir les 
fragments polynuclSotidiques decrits ci-dessus, sont 

10 avantageusement les suivantes : 

1 1 hybridation est realisee a une temperature 
pr§ferentielle de 65°C ; en presence de tampon commercialise 
sous le nom de rapid-hyb buffer par Amersham (RPN 1636) et 
100 M9 /ml d'ADN de E.coli. 

15 Les etapes de lavage peuvent, par exemple, etre les 

suivantes : 

- deux lavages de 10 min, pref erentiellement a 65°C, dans 
un tampon 2 x SSC et 0,1% SDS; 

- deux lavages de 10 min, pref erentiellement a 65°C, dans 
20 un tampon 1 x SSC et 0,1% SDS; 

- un lavage de 10 min, pref erentiellement a 65°C, dans un 
tampon de 0,1 x SSC et 0,1% SDS . 

1 x SSC correspond a 0,15 M NaCl et 0,05M citrate de 
Na et une solution de 1 x Denhardt correspond a 0,02% 
25 Ficoll, 0,02% de polyvinylpyrrolidone et 0,02% de serum 
albumine bovine . 



Avantageusement, un fragment nucleotidique rSpondant a 
la definition pr£c£dente aura au moins 8 nucleotides, de 

30 preference au moins 12 nucleotides, et encore plus 
pr6f erentiellement au moins 20 nucleotides consecutifs de 
lasequence dont il est issu. Les conditions d ■ hybridation 
de forte stringence decrites ci-avant pour un 
polynucleotide d'une taille d' environ 200 bases, seront 

35 adaptees par l'homme du metier pour des oligonucleotides de 
taille plus grande ou plus petite, selon 1 ' enseignement de 
Sambrook et al . , 1989. 



WO 99/09186 



PCT/FR98/01813 



27 



Pour les conditions de mise en oeuvre des enzymes de 
restriction dans le but d'obtenir des fragments 
nucl£otidiques des polynucleotides selon 1' invention, on se 
5 r£f§rera avantageusement a l'ouvrage de Sambrook et al . , 
1989. 

Avantageusement, un polynucleotide de 1* invention 
contiendra au moins une sequence comprenant 1 ■ enchainement 
10 de nucleotides allant du nucleotide en position nt 964 au 
nucleotide nt 1234 du polynucleotide de sequence SEQ ID 
N° 1. 

La presente invention a pour objet un polynucleotide 
15 selon 1' invention, caracterise en ce que sa sequence 
nucleique hybride avec 1 ' ADN de sequence de mycobact£ries 
et preferentiellement avec 1 ' ADN de sequence de 
mycobact£ries appartenant au complexe de Mycobacterium 

tuberculosis . 

20 

Le polynucleotide est code par une sequence 
polynucleotidique telle que decrite supra. 

La presente invention a 6galement pour objet un 
25 polypeptide issu d'une mycobacterie, caracterise en ce 
qu'il est present uniquement chez les mycobacteries 
appartenant au complexe de Mycobacterium tuberculosis. 

L' invention concerne egalement un polypeptide 
30 caracterise en ce qu'il comprend un polypeptide choisi 
parmi : 

a) un polypeptide dont la sequence d'acides amines est 
comprise dans une sequence d'acides amines choisie parmi 
les sequences d'acides amines SEQ ID N°l a SEQ ID N°24C, 

35 SEQ ID N° 27A a SEQ ID N° 28 et SEQ ID N° 30 a SEQ ID N° 
50F, 

b) un polypeptide homologue au polypeptide d£f ini en a) , 
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c) un fragment d'au moins 5 acides amines d'un polypeptide 
def ini en a) ou b) , 

d) un fragment biologiquement actif d'un polypeptide def ini 
en a) , b) , ou c) . 

5 

La pr6sente invention a aussi pour objet un 
polypeptide dont la sequence d f acides aminfes est comprise 
dans la sequence d' acides amines SEQ ID N°l ou SEQ ID N°2, 
ou un polypeptide de sequence d' acides amines SEQ ID N°28. 

10 

Par polypeptide homologue, on entendra designer les 
polypeptides presentant, par rapport au polypeptide naturel 
selon 1' invention tel que le polypeptide DP428, certaines 
modifications comme en particulier une delation, addition 
15 ou substitution d'au moins un acide amin6, une troncation, 
un allongement, une fusion chim£rique, et/ou une mutation. 
Parmi les polypeptides homologues, on prefere ceux dont la 
sequence d 1 acides amines presente au moins 30%, de 
preference 50%, d'homologie avec les sequences d* acides 
20 amines des polypeptides selon 1' invention. Dans le cas 
d'une substitution, un ou plusieurs acides amines 
consecutifs ou non consecutifs, sont remplaces par des 
acides amines « equivalents ». L' expression acide amine 
<k Equivalent » vise ici a designer tout acide amine 
25 susceptible d'etre substitue a l'un des acides amines de la 
structure de base sans cependant modifier essentiellement 
les propriEtEs immunogenes des peptides correspondants . En 
d'autres termes, les acides amines Equivalents seront ceux 
qui permettent l'obtention d'un polypeptide de sequence 
30 modifiee qui permet l 1 induction in vivo d'anticorps ou de 

cellules capables de reconnaitre le polypeptide dont la 
sequence d' acides amines est comprise dans la sequence 
d' acides amines de polypeptide selon 1' invention, telle que 
les sequences d' acides amines SEQ ID N° 1 a SEQ ID N° 2, ou 
35 un polypeptide de sequence d' acides amines SEQ ID N°28 
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(polypeptide DP428) ou 1 ' un de ses fragments ci-dessus 
d£f inis . 

Ces aminoacyles Equivalents peuvent etre determines 
soit en s'appuyant sur leur homologie de structure avec les 
5 aminoacyles auxquels ils se substituent, soit sur les 
r£sultats des essais d 1 immunog£nicite crois£e auxquels les 
differents peptides sont susceptibles de donner lieu. 

A titre d'exemple, on mentionnera les possibility de 
10 substitutions susceptibles d'etre effectuees sans qu'il en 
rSsulte une modification approfondie de 1 1 immunogenicite 
des peptides modifies correspondants , les remplacements, 
par exemple, de la leucine par la valine ou 1 ' isoleucine, 
de l'acide aspartique par l'acide glutamique, de la 
15 glutamine par 1 ' asparagine, de l'arginine par la lysine 
etc., les substitutions inverses etant naturellement 
envisageables dans les memes conditions. 

Par fragment biologiquement actif, on entendra 
20 designer en particulier un fragment de sequence d'acides 
amines de polypeptide pr£sentant au moins une des 
caracteristiques des polypeptides selon l f invention, 
notamment en ce qu'il est : 

capable d'etre export^ et/ou secr£t£ par une 
25 mycobacterie, et/ou d'etre induit ou reprime lors de 
1' infection par la mycobacterie ; et/ou 

capable d'induire, de riprimer ou de moduler, 
directement ou indirectement , un facteur de virulence de 
mycobacterie ; et/ou 
30 - capable d'induire une reaction d ' immunogenicite dirigee 
contre les mycobacteries ; et/ou 

- capable d'etre reconnu par un anticorps specif ique de 
mycobacterie . 

35 Par fragment de polypeptide, on entend designer un 

polypeptide comportant au minimun 5 acides amines, de 
preference 10 acides amines et 15 acides amines. 
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Un polypeptide de 1' invention, ou un de ses 
fragments, tels que definis pr6cedemment , est susceptible 
d'etre reconnu specif iquement par les anticorps presents 
5 dans le s6rum de patients infect<§s par des mycobact6ries et 
pr§f erentiellement des bact§ries appartenant au complexe de 
Mycobacterium tuberculosis ou par des cellules de I'hote 

infects. 

Font ainsi partie de 1* invention les fragments du 
10 polypeptide dont la sequence d'acides amines est comprise 
dans la sequence d'acides amines de polypeptide selon 
1' invention, telle que les sequences d'acides amines SEQ ID 
N°l a SEQ ID N°2, ou un polypeptide de sequence d'acides 
amines SEQ ID N°28, qui peuvent etre obtenus par clivage 
15 dudit polypeptide par une enzyme proteolytique, telle que 
la trypsine ou la chymotrypsine ou la collag£nase, ou par 
un r£actif chimique, tel que le bromure de cyanogene (CNBr) 
ou encore en plaqrant un polypeptide selon 1' invention tel 
que le polypeptide DP428 dans un environnement tres acide, 
20 par exemple a pH 2,5. Des fragments peptidiques preferes 
selon 1' invention, pour une utilisation en diagnostic ou en 
vaccination, sont les fragments contenus dans des regions 
de polypeptide selon 1' invention tel que le polypeptide 
DP428 susceptibles d'etre naturellement expos^es au solvant 
25 et de presenter ainsi des propriStes d 1 immunogenicite 
importante, De tels fragments peptidiques peuvent etre 
prepares indif f 6remment par synthese chimique, & partir 
d'hotes transform^ par un vecteur d' expression selon 
1' invention contenant un acide nucleique permettant 
30 1' expression desdits fragments, place sous le contrfile des 
elements de regulation et/ou d' expression appropries ou 
encore par clivage chimique ou enzymatique. 

Une analyse de 1 ' hydrophilicite du polypeptide DP428 a 
35 6te realis£e a l ! aide du logiciel DNA Strider™ 
(commercialise par le CEA Saclay) , sur la base d'un calcul 
du caractere hydrophile de la region codante pour le DP428 
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de la SEQ ID N°28. Les resultats de cette analyse sont 
presentes a la figure 54, od sont detailles, pour chacun 
des acides amines (AA) de position definie dans la SEQ ID 
N°28, l'indice d ' hydrophilicite . Plus l'indice 

5 d' hydrophilicite est eieve, plus l'acide amine considere 
est susceptible d'etre expose au solvant dans la molecule 
native, et est en consequence susceptible de presenter un 
degre d' antigenicity eieve. Ainsi, un enchalnement d'au 
moins sept acides amines possedant un indice eieve 

10 d' hydrophilicite (>0,3) peut constituer la base de la 
structure d'un peptide candidat immunogene selon la 
presente invention . 

Les r£ponses immunitaires cellulaires de l'hote a un 
15 polypeptide selon 1' invention, peuvent etre mises en 
evidence selon les techniques decrites par Colignon et al . , 
1996. 

D'apres les donnees de la carte d ' hydrophilicite 
20 presentee a la Figure 54, les inventeurs ont pu definir des 
regions du polypeptide DP428 pref erent iellement exposees au 
solvant, plus particulierement la region localisee entre 
les acides amines 55 et 72 de la sequence SEQ ID N° 28 et 
la region localisee entre les acides amines 99 et 107 de la 
25 SEQ ID N° 28. 

Les regions peptidiques du polypeptide DP428 definies 
ci-dessus peuvent etre avantageusement mises en oeuvre pour 
la realisation des compositions immunogenes ou des 
30 compositions vaccinales selon 1' invention. 

Les polynucleotides caracterises en ce qu'ils codent 
pour un polypeptide selon 1' invention, font egalement 
partie de 1' invention. 

35 

L 1 invention concerne egalement les sequences d'acide 
nucleique* utilisables comme sonde ou amorce, caracterisees 
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en ce que lesdites sequences sont choisies parmi les 
sequences d'acide nucleique de polynucleotides selon 
1 1 invention . 

5 L 1 invention concerne en outre 1 1 utilisation d'une 

sequence d ! acide nucleique de polynucleotides selon 
1' invention comme sonde ou amorce, pour la detection et/ou 
1 1 amplification de sequence d'acide nucleique. Parmi ces 
sequences d'acide nucleique selon 1' invention utilisables 

10 comme sonde ou amorce, on prefere les sequences d'acide 
nucleique de 1' invention, caracterisee en ce que lesdites 
sequences sont des sequences, ou leur sequence 
complementaire, comprises entre le nucleotide en position 
nt 964 et le nucleotide en position nt 1234, extremites 

IS indues, de la sequence SEQ ID N°l. 

Parmi les polynucleotides selon l 1 invention, 
utilisables comme amorces nucleotidiques , on prefere 
particulierement les polynucleotides de sequence SEQ ID 
20 N°25 et SEQ ID N°26. 

Les polynucleotides selon 1' invention peuvent ainsi 
etre utilises pour selectionner des amorces nucleotidiques, 
notamment pour la technique PCR (Erlich, 1989 ; Innis et 
25 al., 1990, et, Rolfs et al . , 1991). 

Cette technique necessite le choix de paires 
d ! oligonucleotides encadrant le fragment qui doit etre 
amplifie. On peut, par exemple, se riferer & la technique 

30 decrite dans le brevet am£ricain U.S. N° 4 683 202. Ces 
amorces ol igodesoxyr ibonucl€ot idiques ou ol igor ibo - 
nucleotidiques ont avantageusement une longueur d'au moins 
8 nucleotides, de preference d'au moins 12 nucleotides, et 
encore plus pref erentiellement au moins 20 nucleotides. On 

35 preferera en particulier des amorces d'une longueur 
comprise entre 8 et 30 et de preference 12 et 22 
nucleotides. L'une des deux amorces est compiementaires du 
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brin (+) [amorce aller] de la matrice et 1' autre amorce est 
complementaire du brin (-) [amorce retour] . II est 
important que les amorces ne possedent pas de structure 
secondaire ou de sequence complementaire l'une de 1* autre. 

5 D' autre part, la longueur et la sequence de chaque amorce 
doivent etre choisies de maniere k ce que les amorces ne 
s'hybrident pas avec d'autres acides nucl£iques provenant 
de cellules procaryotes ou eucaryotes, en particulier avec 
les acides nucl£iques provenant d*autres mycobacteries 

K) pathogSnes, ni avec l'ADN ou l'ARN humain pouvant 
eventuellement contaminer 1 * echantillon biologique. 

Les resultats presentes a la figure 51, montrent que 
la sequence codant pour le polypeptide DP428 (SEQ ID N° 28) 
15 n'est pas retrouvee dans les ADNs de M. fortuitum, M . 

simiae t M. avium, M. chelonae, M. flavescens , M. gordonae, 

M. marinum et M. kansasii 

Les fragments amplifies peuvent etre identifies apres 
20 une electrophorese en gel d 1 agarose ou de polyacrylamide , 
ou apres une electrophorese capillaire, ou encore apres une 
technique chromatographique (filtration sur gel, 
chroma tographie hydrophobe ou chromatographie echangeuse 
d'ions). La specificite de 1 ' amplification peut etre 
25 control£e par hybridation moleculaire en utilisant comme 
sondes les sequences nucl6otidiques de polynucleotides de 
1' invention, des plasmides contenant ces sequences ou leurs 
produits d' amplification. 

30 Les fragments nucl£otidiques amplifies peuvent etre 

utilises comme r£actifs dans des reactions d 1 hybridation 
afin de mettre en evidence la presence, dans un echantillon 
biologique, d'un acide nucl6ique cible de sequence 
complementaire a celle desdits fragments nucleotidiques 

35 amplifies. 
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Parmi les polynucleotides selon 1' invention, 
utilisables comme sondes nucleotidiques , on prefere tout 
particulierement le fragment polynucieotidique comprenant 
la sequence comprise entre le nucleotide en position nt 964 
5 et le nucleotide en position nt 1234, extrdmites indues, 
de la sequence de SEQ ID N°l. 

Ces sondes et amplicons peuvent etre marques ou non 
par des elements radioactifs ou par des molecules non 
10 radioactives, telles que des enzymes ou des Elements 
f luorescents . . 

L 1 invention vise egalement les fragments 
nucleotidiques susceptibles d'etre obtenus par 

15 amplification a 1 ' aide d' amorces selon 1' invention. 

D'autres techniques d 1 amplification de l'acide 
nucleique cible peuvent etre avantageusement employees 
comme alternatives a la PCR. 

20 La technique SDA (Strand Displacement Amplification) 

ou technique d ' amplification a deplacement de brin (Walker 
et al., 1992) est une technique d 1 amplification isotherme 
dont le principe est fonde sur la capacite d'une enzyme de 
restriction de couper l'un des deux brins de son site de 

25 reconnaissance qui se trouve sous une forme 
hemiphosphorothioate et sur la propriete d'une ADN 
polymerase d'initier la synthase d'un nouveau brin d' ADN a 
partir de l'extremite 3' OH creee par 1* enzyme de 
restriction et de deplacer le brin prialablement synthetise 

30 qui se trouve en aval . 

Les polynucleotides de 1' invention, en particulier les 
amorces selon 1' invention, peuvent egalement etre mis en 
oeuvre dans d'autres procedes d' amplification d'un acide 
nucl6ique cible, tels que : 

35 - la technique TAS (Transcription-based Amplification 
System), decrite par Kwoh et al . en 1989; 
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- la technique 3SR (Self -Sustained Sequence Replication) , 
decrite par Guatelli et al . en 1990; 

la technique NASBA (Nucleic Acid Sequence Based 
Amplification), decrite par Kievitis et al . en 1991; 
5 - la technique TMA (Transcription Mediated Amplification) . 

Les polynucleotides de 1' invention peuvent aussi etre 
employes dans des techniques d 'amplification ou de 
modification de I'acide nucl£ique servant de sonde, telles 
que : 

10 - la technique LCR (Ligase Chain Reaction) , decrite par 
Landegren et al . en 1988 et perfect ionnee par Barany et al. 
en 1991, qui emploie une ligase thermostable; 

- la technique de RCR (Repair Chain Reaction) , decrite par 
Segev en 1992; 

15 - la technique CPR (Cycling Probe Reaction) , decrite par 
Duck et al. en 1990; 

la technique d ' amplification a la Q-beta-replicase, 
decrite par Miele et al. en 1983 et perfect ionnee notamment 
par Chu et al . en 1986, Lizardi et al . en 1988, puis par 

20 Burg et al . ainsi que par Stone et al . en 1996. 

Dans le cas oQ le polynucleotide cible a detecter est 
un ARN, par exemple un ARNm, on utilisera avantageusement , 
pr^alablement a la mise en oeuvre d'une reaction 

25 d 1 amplification a l'aide des amorces selon l 1 invention ou a 
la mise en oeuvre d'un procede de detection a l'aide des 
sondes de 1' invention, une enzyme de type transcriptase 
inverse afin d'obtenir un ADNc a partir de 1 1 ARN contenu 
dans 1 '6chantillon biologique. L ' ADNc obtenu servira alors 

30 de cible pour les amorces ou les sondes mises en oeuvre 
dans le procede d' amplification ou de detection selon 
1 1 invention . 

La sonde de detection sera choisie de telle maniere a 
35 ce qu'elle hybride avec l'amplicon genere. Une telle sonde 
de detection aura avantageusement pour sequence une 
sequence • d' au moins 12 nucleotides, en particulier d'au 
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moins 15 nucleotides, et de preference au moins de 200 
nucleotides . 

Les sondes nucleotidiques selon 1' invention sont 
capables de d6tecter des mycobacteries et 

5 preferentiellement des bact£ries appartenant au complexe de 
Mycobacterium tuberculosis, plus prdcisement du fait que 
ces mycobacteries poss&dent dans leur genome au moins une 
copie de polynucleotides selon 1' invention. Ces sondes 
selon 1 1 invention, sont capables, par exemple, de 

10 s'hybrider avec la sequence nucleot idique d'un polypeptide 
selon l r invention, plus particulierement tout 
oligonucleotide hybridant avec la sequence SEQ ID N°l 
codant pour le polypeptide DP428 de M. tuberculosis, et ne 
presentant pas de reaction d ' hybridation croisee ou 

15 d' amplification (PCR) avec par exemple des sequences 
presentes chez des mycobacteries n ' appartenant pas au 
complexe de Mycobacterium tuberculosis, Les sondes 
nucleotidiques selon 1* invention hybrident specif iquement 
avec une molecule d'ADN ou d'ARN de polynucleotide selon 

20 1' invention, dans des conditions d 1 hybridation de forte 
stringence telles que donnees sous forme d 1 exemple 
precedemment . 

Les sequences non marquees peuvent etre utilisees 
25 directement comme sondes, cependant les sequences sont 
generalement marquees par un Element radioactif ("p, 35 s, 
3 H, l25 I) ou par une molecule non-radioactive (biotine, 
acStylaminof luorene , digoxig^nine , 5 -bromo-d6soxyuridine , 
f luoresceine) pour obtenir des sondes utilisables pour de 
30 nombreuses applications. 

Des exemples de marquages non radioactifs de sondes 
sont decrits, par exemple, dans le brevet fran<?ais N° 
78.10975 ou par Urdea et al . ou par Sanchez-Pescador et al. 
35 en 1988. 
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Dans ce dernier cas, on pourra aussi utiliser l'une 
des methodes de marquage decrites dans les brevets FR 2 422 
956 et FR 2 518 755. La technique d 1 hybridation peut etre 
rSalisSe de manieres diverses (Matthews et al., 1988). La 

5 m§thode la plus g6n£rale consiste a immobiliser l'acide 
nucleique extrait des cellules de mycobact6ries sur un 
support (tel que nitrocellulose, nylon, polystyrene) et a 
incuber, dans des conditions bien d6finies, l'acide 
nuclSique cible immobilise avec la sonde. Apres 

It) 1 1 hybridation, I'exces de sonde est elimine et les 
molecules hybrides formees sont detect6es par la methode 
appropriee (mesure de la radioactivite , de la fluorescence 
ou de l'activite enzymatique liee a la sonde). 

15 Avantageusement , les sondes nucl6otidiques marquees 

selon 1' invention peuvent avoir une structure telle 
qu'elles rendent possible une amplification du signal 
radioactif ou non-radioactif . Un systeme d 1 amplification 
repondant a la definition ci-dessus comprendra des sondes 
20 de detection sous la forme d'un ADN ramifie, branche 
(^branched DNA») telles que celles decrites par Urdea et 
al . en 1991. Selon cette technique, on utilisera avanta- 
geusement plusieurs types de sondes notamment une sonde de 
capture, afin d' immobiliser l'ADN ou l'ARN cible sur un 
25 support, et une sonde de detection. La sonde de detection 
lie un ADN «branch§» pr€sentant une structure ramifi§e. 
L'ADN branche, a son tour, est capable de fixer des sondes 
oligonucl€otidiques qui sont elles-memes couplees a des 
molecules de phosphatase alcaline. Puis 1* activity de cette 
30 enzyme est mise en evidence grace a un substrat chimio- 
luminescent, par exemple un derive du dioxetane-phosphate . 

Selon un autre mode avantageux de mise en oeuvre des 
sondes nucl£iques selon 1' invention, ces dernidres peuvent 
35 etre immobilisSes sur un support, de maniere covalente ou 
non covalente, et utilises comme sondes de capture. Dans 
ce cas, une sonde, dite «sonde de captures, est immobilisee 



WO 99/09186 



PCT/FR98/01813 



38 



sur un support et sert a capturer par hybridation sp£ci- 
fique l'acide nucleique cible obtenu a partir de l'Schan- 
tillon biologique a tester. Si necessaire, le support 
solide est s6par£ de 1 ' echantillon et le duplex forme entre 
5 la sonde de capture et l'acide nucleique cible est ensuite 
detecte grace a une seconde sonde, dite «sonde de 
detections, marquee par un Element facilement detectable. 

Les fragments oligonucieotidiques peuvent etre obtenus 
10 a partir des sequences selon 1' invention, par coupure avec 
des enzymes de restriction, ou par synthese chimique selon 
les methodes classiques, par exemple selon la methode 
decrite dans le brevet europeen N° EP-0305929 (Millipore 
Corporation) ou encore par d'autres procedes. 
15 Un mode de preparation approprie des acides nucleiques 

de 1' invention comportant au maximum 200 nucleotides (ou 
200 pb s'il s'agit d' acides nucleiques bicatSnaires) 
comprend les etapes suivantes : 

- la synthese d'ADN en utilisant la methode automat isee des 
20 beta-cyanethylphosphoramidite decrite en 1986, 

- le clonage des acides nucleiques ainsi obtenus dans un 
vecteur approprie et la recuperation des acides nucleiques 
par hybridation avec une sonde appropriee. 

Un mode de preparation, par voie chimique, d' acides 
25 nucleiques selon 1' invention de longueur supSrieure a 200 
nucleotides (ou 200 pb lorsqu'il s'agit d' acides nucleiques 
bicatenaires) comprend les etapes suivantes : 

- 1' assemblage d ■ oligonucleotides synthetises chimiquement , 
pourvus a leur extremite de sites de restrictions 

30 differents, dont les sequences sont compatibles avec 
1 ' enchainement en acides amines du polypeptide naturel 
selon le principe decrit en 1983, 

- le clonage des acides nucleiques ainsi obtenus dans un 
vecteur approprie et la recuperation des acides nucleiques 

35 recherches par hybridation avec une sonde appropriee . 



WO 99/09186 



PCT/FR98/01813 



39 



Les sondes nuclgotidiques utilisees pour la 
recuperation des acides nucleiques recherchSs dans les 
proc<§des sus-ment ionn£s , sont constitutes g6n§ralement de 8 
a 200 nucleotides de la sequence de polypeptide selon 
5 1' invention et sont susceptibles de s'hybrider avec l'acide 
nuclSique recherche dans les conditions d ' hybridation 
inies pr6c6demment . La synthase de ces sondes peut etre 
effectu6e selon la mfithode automatiste des beta 
cyanethylphosphoramidites decrite en 1986. 

10 

Les sondes oligonucleot idiques selon 1' invention 
peuvent etre mises en oeuvre au sein d'un dispositif de 
detection comprenant une banque matricielle 

d' oligonucleotides . Un exemple de realisation d'une telle 

15 banque matricielle peut consister en une matrice 
d 1 oligonucleotides sondes fixes sur un support, la sequence 
de chaque sonde d'une longueur donnee etant situee en 
decalage d'une ou plusieurs bases par rapport a la sonde 
precedente, chacune des sondes de 1 1 arrangement matriciel 

20 etant ainsi complementaire d'une sequence distincte de 
l'ADN ou I'ARN cible a detecter et chaque sonde de sequence 
connue etant fix£e en une position predeterminee du 
support. La sequence cible a detecter peut etre 
avantageusement marquee radioactivement ou non 

25 radioactivement. Lorsque la sequence cible marquee est mise 
en contact avec le dispositif matriciel, celle-ci forme des 
hybrides avec les sondes de sequences complSmentaires . Un 
traitement a la nuclease, suivi d'un lavage, permet 
d'eliminer les hybrides sondes -sequence cible qui ne sont 

30 pas parfaitement complementaires . Du fait de la 
connaissance precise de la sequence d'une sonde a une 
position d§terminee de la matrice, il est alors possible de 
dtduire la sequence nucleotidique de la sequence d'ADN ou 
d'ARN cible. Cette technique est particulierement efficace 

35 lorsque sont utilises des matrices de sondes 
oligonucl^otidiques de grande taille. 



WO 99/09186 



PCT/FR98>01813 



40 

Une alternative a 1 ' utilisation d'une sequence cible 
marquee peut consister en 1 ' utilisation d'un support 
permettant une detection « bioelectronique » de 
1 ■ hybridation de la sequence cible sur les sondes du 

5 support matrice, lorsque que ledit support est constitu§ ou 
comprend un mat6riau capable d'agir, par exemple, en tant 
que donneur d' electrons aux positions de la matrice 
auxquelles un hybride a 6t6 forme. Un tel materiau donneur 
d' electron est par exemple de l'or. La detection de la 

10 sequence nucleotidique de l'ADN ou ARN cible est alors 
determinee par un dispositif electronique . 

Un exemple de realisation d'un biocapteur, tel que 
dSfini ci-dessus, est decrit dans la demande de brevet 
15 europeen N° EP-0721 016 au nom de Affymax technologies N,V. 
ou encore dans le brevet americain N° US 5.202.231 au nom 
de Drmanac. 

L 1 invention a aussi pour objet les polynucleotides 
hybrides resultant : 
20 - soit de la formation d'une molecule hybride entre un ARN 
ou un ADN (ADN genomique ou ADNc) provenant d'un 
echantillon biologique avec une sonde ou une amorce selon 
1 1 invention. 

- soit de la formation d'une molecule hybride entre un ARN 
25 ou un ADN (ADN genomique ou ADNc) provenant d'un 
echantillon biologique avec un fragment nucleotidique 
amplifii a l'aide d'un couple d' amorces selon 1' invention. 

Par ADNc au sens de la presente invention, on entend 
une molecule d 1 ADN obtenue en faisant agir une enzyme de 
30 type transcriptase inverse sur une molecule d'ARN, en 
particulier une molecule d'ARN messager (ARNm) , selon les 
techniques decites dans Sambrook et al . en 1989. 

La presente invention a egalement pour objet une 
famille de plasmides recombinants, caracterises en ce 
35 qu'ils contiennent au moins une sequence nucleotidique de 
polynucleotide selon 1* invention. Selon un mode de 
realisation avantageux dudit plasmide, il comprend la 
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sequence nucleotidique SEQ ID N°l ou un fragment de celle- 
ci . 

Un autre objet de la presente invention est un vecteur 
pour le clonage, 1 * expression et/ou 1' insert ion d'une 
5 sequence, caract6ris£ en ce qu'il comprend une sequence 
nucleotidique de polynucleotide selon 1' invention en un 
site non essentiel pour sa replication, le cas 6ch£ant sous 
le controle d ! elements de regulation susceptibles 
d f intervenir dans 1' expression du polypeptide DP428, chez 
10 un hote determine. 

Des vecteurs particuliers sont par exemple des 
plasmides, des phages, des cosmides, des phagemides, des 
YAC. 

Ces vecteurs sont utiles pour transformer des cellules 
15 hotes afin de doner ou d'exprimer les sequences 
nucleotidiques de 1' invention. 

L f invention comprend egalement les cellules hotes 
transformees par un vecteur selon 1' invention. 

20 

De preference, les cellules hotes sont transformees 
dans des conditions permettant 1' expression d'un 
polypeptide recombinant selon 1' invention. 

25 Une cellules hote preferee selon 1* invention est la 

souche B. coli transformee par le plasmide pDP428 depose le 
28 janvier 1997 a la CNCM sous le N°I-1818 ou transformee 
par le plasmide pMlC25 depose le 4 aout 1998 a la CNCM sous 
le n° 1-2062 ou une mycobacterie appartenant a une souche 

30 de M. tuberculosis, M.bovis ou M.africanum possedant 
potentiellement tous lea systemes de regulation appropries. 

II est aujourd'hui facile de produire des proteines ou 
polypeptides en quantite relativement importante par genie 
genetique en utilisant comme vecteurs d' expression des 

35 plasmides, des phages, des phagemides. Tout ou partie du 
gSne DP428, ou tout polynucleotide selon 1* invention, peut 
etre insere dans un vecteur d' expression approprie pour 
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produire in vitro un polypeptide selon 1' invent ion, 
notamment le polypeptide DP428, Ledit polypeptide pourra 
etre fixe sur une microplaque pour developper un test 
s6rologique destine a rechercher, dans un but de 
5 diagnostic, les anticorps sp6cifiques chez les patients 
atteints de tuberculose. 

Ainsi, la presente invention concerne un precede de 
preparation d'un polypeptide, caracterise en ce qu'il met 
10 en oeuvre un vecteur selon 1' invention. Plus 
particulierement 1* invention concerne un precede de 
preparation d'un polypeptide de 1* invention comprenant les 
etapes suivantes : 

- le cas echeant, 1 1 amplification pr6alable suivant la 

15 technique PCR de la quantite de sequences de nucleotides 
codant pour ledit polypeptide a l'aide de deux amorces 
d'ADN choisies de maniere a ce que l'une de ces amorces 
soit identique aux 10 a 25 premiers nucleotides de la 
sequence nucleot idique codant pour ledit polypeptide, 

20 tandis que l 1 autre amorce est complementaire des 10 a 25 
derniers nucleotides (ou s'hybride avec ces 10 a 2 5 
derniers nucleotides) de ladite sequence nucleot idique , ou 
inversement de maniere a ce que l'une de ces amorces soit 
identique aux 10 a 25 derniers nucleotides de ladite 

25 sequence, tandis que 1' autre amorce est complementaire des 
10 a 25 premiers nucleotides (ou s'hybride avec les 10 a 25 
premiers nucleotides) de ladite sequence nucieot idique, 
suivie de 1 1 introduction desdites sequences ainsi 
amplifiees dans un vecteur approprie, 

30 - la mise en culture, dans un milieu de culture approprie, 
d'un hote cellulaire prealablement transforme par un 
vecteur approprie contenant un acide nucleique selon 
l 1 invention comprenant la sequence nucleotidique codant 
pour ledit polypeptide, et 
35 - la separation, a partir du susdit milieu de culture, 
dudit polypeptide produit par ledit hdte cellulaire 
transforme . 
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L ' invention a aussi pour objet un polypeptide 
susceptible d'etre obtenu par un proc<§d<§ de 1' invention tel 
que decrit pr§c£demment . 
5 Les peptides selon 1' invention peuvent 6galement etre 

pr£par6s par les techniques classiques, dans le domaine de 
la synthese des peptides. Cette synthese peut etre rSalisee 
en solution homogene ou en phase solide. 

Par exemple, on aura recours a la technique de 
10 synthese en solution homogene decrite par Houbenweyl en 
1974 . 

Cette methode de synthese consiste a condenser 
successivement deux-a-deux les aminoacyles successifs dans 

15 l'ordre requis, ou a condenser des aminoacyles et des 
fragments prealablement formes et contenant deja plusieurs 
aminoacyles dans I'ordre approprie, ou encore plusieurs 
fragments prealablement ainsi prepares, etant entendu que 
l'on aura eu soin de proteger au prealable toutes les 

20 fonctions reactives portees par ces aminoacyles ou 
fragments, a 1' exception des fonctions amines de 1 1 un et 
carboxyles de 1' autre ou vice-versa, qui doivent 
normalement intervenir dans la formation des liaisons 
peptidiques, notamment apres activation de la fonction 

25 carboxyle, selon les m§thodes bien connues dans la synthese 
des peptides. En variante, on pourra avoir recours a des 
reactions de couplage mettant en jeu des reactifs de 
couplage classique, du type carbodiimide , tels que par 
exemple la l-ethyl-3 - (3-dim6thyl-aminopropyl) -carbodiimide . 

30 Lorsque 1 ' aminoacyle mis en oeuvre poss&de une 

fonction acide supplementaire (notamment dans le cas de 
l'acide glutamique) , ces fonctions seront protegees, par 
exemple par des groupes t-butylester . 

Dans le cas de la synthese progressive, acide amine 
35 par acide amine, la synthese debute de preference par la 
condensation de 1 1 amino-acide C- terminal avec 1 ' aminoacide 
qui correspond a l'aminoacyle voisin dans la sequence 
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desir§e et ainsi de suite, de proche en proche, jusqu'a 
1' acide amine N- terminal . 

Selon une autre technique pref£r£e de 1' invention, on 
a recours a celle dgcrite par Merrifield. 

5 Pour fabriquer une chaine peptidique selon le procdde 

de Merrifield, on a recours a une r§sine polymdre tres 
poreuse, sur laquelle on fixe le premier acide amine C- 
terminal de la chaine. Cet acide amin§ est fix6 sur la 
resine par 1 ' interm£diaire de son groupe carboxylique et sa 

U) fonction amine est protegee, par exemple par le groupe t- 
butyloxycarbonyle . 

Lorsque le premier acide amine C-terminal est ainsi 
fixe sur la resine, on enleve le groupe protecteur de la 
15 fonction amine en lavant la resine avec un acide. 

Dans le cas oO le groupe protecteur de la fonction 

amine est le groupe t -butyloxycarbonyle , il peut etre 

elimine par traitement de la resine a 1'aide d' acide 
20 trif luoroacetique . 

On couple ensuite le deuxieme acide amine qui fournit 
le second aminoacyle de la sequence recherchee, a partir du 
residu aminoacyle C-terminal sur la fonction amine 
25. deprotegee du premier acide amine C-terminal fixe sur la 
chaine. De pr§f6rence, la fonction carboxyle de ce deuxieme 
acide amini est activ£e, par exemple par la 
dicyclohexylcarbodiimide, et la fonction amine est 
protegee, par exemple par le t -butyloxycarbonyle . 
30 On obtient ainsi la premiere partie de la chaine 

peptidique recherchee, qui comporte deux acides amines, et 
dont la fonction amine terminale est protegee. Comme 
pr£c§demment , on d6protege la fonction amine et on peut 
ensuite procSder a la fixation du troisidme aminoacyle, 
35 dans des conditions analogues a celles de 1' addition du 
deuxieme acide amine C-terminal. 
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On fixe ainsi, les uns apres les autres, les acides 
amines qui vont constituer la chaine peptidique sur le 
groupe amine chaque fois deprotege au prealable de la 
portion de la chaine peptidique deja form£e, et qui est 
5 rattach£e a la rSsine. 

Lorsque la totality de la chaine peptidique d£sir6e 
est form6e, on ^limine les groupes protecteurs des 
diff^rents acides amines constituant la chaine peptidique 
et on d£tache le peptide de la resine, par exemple a l'aide 
10 d'acide f luorhydrique . 

De maniere pref erentielle, lesdits polypeptides 
susceptibles d'etre obtenus par un procede de 1' invention 
tel que decrit precedemment comprendront une region exposee 
15 au solvant et auront une longueur d'au moins 20 acides 
amines . 

Selon un autre mode de realisation de 1' invention, 
lesdits polypeptides sont specifiques de mycobacteries du 
20 complexe Mycobacterium tuberculosis et ne sont done pas 

reconnus par des anticorps specifiques d' autres proteines 
de mycobacteries. 

V invention est en outre relative a des polypeptides 
25 hybrides pr£sentant au moins un polypeptide selon 
1' invent ion et une sequence d'un polypeptide susceptible 
d'induire une reponse immunitaire chez l'homme ou 1 ! animal. 

Avantageusement , le determinant antigSnique est tel 
qu ! il est susceptible d'induire une reponse humorale et/ou 
30 cellulaire. 

Un tel determinant pourra comprendre un polypeptide 
selon 1' invention sous forme glycosylSe utilise en vue 
d'obtenir des compositions immunogenes susceptibles 
35 d'induire la synthese d* anticorps diriges contre des 
epitopes multiples. Lesdits polypeptides glycosyles font 
6galement partie de 1' invention. 
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Ces molecules hybrides peuvent etre constitutes en 
partie d'une molecule porteuse de polypeptide selon 
1' invention associte a une partie, en particulier un 
Epitope de la toxine diphterique, la toxine t6tanique, un 
5 antigdne de surface du virus de 1' hepatite B (brevet FR 79 
21811), 1' antigene VP1 du virus de la poliomySlite ou toute 
autre toxine ou antigene viral ou bacttrien. 

Avantageusement , ledit determinant antigtnique 
10 correspond a un determinant antigenique de proteines 
immunogenes de 45/47 kD de M. tuberculosis (demande 

internationale PCT/FR 96/0166) , ou encore selectionn6es par 
exemple parmi ESAT6 (Harboe et al . , 1996, Andersen et al . , 
1995, et Sorensen et al., 1995) et DES (PCT/FR 97/00923, 
15 Gicquel et al . ) . 

Un antigene viral, tel que defini ci-dessus, sera 
pref erentiellement une proteine de surface ou d'enveloppe 
d'un virus de 1' hepatite, par exemple la proteine de 
20 surface de l'hepatite B sous l'une de ses formes S, S- 
preSl, S-preS2 ou S-preS2-preSl ou encore une proteine d'un 
virus de l'hepatite A, ou d'une hepatite non-A, non-B, tel 
qu ! un virus de l'hepatite C, E ou delta. 

25 Plus particulierement , un antigene viral tel que 

defini ci-dessus sera tout ou partie de l'une des 
glycoprotSines cod6es par le gSnome du virus HIV-1 (brevets 
GB 8324800, EP 84401834 ou EP 85905513) ou du virus HIV-2 
(EP 87400151), et en particulier tout ou partie d'une 

30 proteine select ionnee parmi gag, pol, nef ou env de HIV-l 
ou de HIV-2. 

Les procedes de synthese des molecules hybrides 
englobent les methodes utilisees en genie genetique pour 
35 construire des polynucleotides hybrides codant pour les 
sequences polypeptidiques recherchees . On pourra, par 
exemple, "* se referer avantageusement a la technique 
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d'obtention de genes codant pour des proteines de fusion 
decrite par Minton en 1984. 

Lesdits polynucleotides hybrides codant pour un 
5 polypeptide hybride ainsi que les polypeptides hybrides 
selon 1' invention caractErisEs en ce qu'il s'agit de 
proteines recombinantes obtenues par 1' expression desdits 
polynucleotides hybrides, font Egalement partie de 
1 ' invention. 

10 

Les polypeptides selon 1 1 invention peuvent 
avantageusement etre mis en oeuvre dans un precede pour la 
detection in vitro d'anticorps diriges contre lesdits 

polypeptides, notamment le polypeptide DP428, et ainsi 
15 d'anticorps diriges contre une bacterie du complexe 
Mycobacterium tuberculosis, dans un echantillon biologique 

(tissu ou fluide biologique) susceptible de les contenir, 
ce procede comprenant la mise en contact de cet echantillon 
biologique avec un polypeptide seLon 1' invention dans des 
20 conditions permettant une reaction immunologique in vitro 
entre ledit polypeptide et les anticorps eventuellement 
presents dans 1 1 Echantillon biologique, et la mise en 
evidence in vitro des complexes antigene-anticorps 
Eventuellement formes . 

25 

Les polypeptides selon l 1 invention peuvent Egalement 
et avantageusement etre mis en oeuvre dans un proc§de pour 
la detection d'une infection par une bactErie du complexe 
Mycobacterium tuberculosis dans un mammifere base sur la 

30 detection in vitro d'une reaction cellulaire indiquant une 

sensibilisation prealable du mammifere audit polypeptide 
comme par exemple la proliferation cellulaire, la synthese 
de proteines telles que 1' interferon gamma. Ce proced€ pour 
la detection d'une infection par une bacterie du complexe 
35 Mycobacterium tuberculosis dans un mammifere, est 

caract§ris6 en ce qu'il compr end les etapes suivantes : 
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a) preparation d'un echantillon biologique contenant des 
cellules dudit mammifere plus part iculierement des cellules 
du systeme immunitaire dudit mammifere et plus 
particulierement encore des cellules T ; 
5 b) incubation de 1 ■ Echantillon biologique de l'6tape a) 
avec un polypeptide selon 1' invention; 

c) detection d'une reaction cellulaire indiquant une 
sensibilisation pr6alable du mammifere audit polypeptide 
comme par exemple la proliferation cellulaire et/ou la 
10 synthese de prot£ines telles que 1 ' interferon gamma. 

La proliferation cellulaire pourra etre mesuree, par 
exemple par incorporation de 'H-Thymidine . 

Font egalement partie de 1' invention, les procedes de 
15 detection d'une reaction d'hypersensibilite retardee (DTH) , 
caracterises en ce qu'ils mettent en oeuvre un polypeptide 
selon 1' invention. 

De preference, 1 ' echantillon biologique est constitue 
20 par un fluide, par exemple un serum humain ou animal, du 
sang, des biopsies, le liquide broncho-alveolaire ou le 
liquide pleural. 

Toute procedure classique peut etre mise en oeuvre 
25 pour realiser une telle detection. 

A titre d 1 exemple, une methode pr£f£r£e met en jeu des 
processus immunoenzymatiques selon la technique ELISA, par 
immunofluorescence, ou radio- immunologique (RIA) ou 
30 equivalent . 

Ainsi, 1' invention concerne egalement les polypeptides 
selon 1* invention, marques a l'aide d'un marqueur adequat 
tel que du type enzymatique, fluorescent, radioactif. 
35 De telles methodes comprennent par exemple les Stapes 

suivantes : 
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depot de quantites determinees d'une composition 
polypeptidique selon 1' invention dans les puits d'une 
plaque de microtitration, 

- introduction dans lesdits puits de dilutions croissantes 
5 de sErum, ou d' echantillon biologique autre tel que defini 

prec£demment , devant etre analyst, 

- incubation de la microplaque, 

introduction dans les puits de la plaque de 
microtitration d' anticorps marques dirigEs contre des 

10 immunoglobulines humaines ou animales, le marquage de ces 
anticorps ayant 6te realise a l'aide d'une enzyme 
select ionnee parmi celles qui sont capables d'hydrolyser un 
substrat en modifiant 1' absorption des radiations de ce 
dernier, au moins a une longueur d'onde determinee, par 

15 exemple a 550 nm, 

- detection, en comparaison avec un temoin de controle, de 
la quantite de substrat hydrolyse. 

L' invention concerne egalement un necessaire ou kit 
20 pour le diagnostic in vitro d'une , infection par une 
mycobacterie appartenant au complexe Mycobacterium 

t ubercul osi s , comprenan t : 

- un polypeptide selon 1' invention, 

- le cas §ch£ant les reactifs pour la constitution du 
25 milieu propice & la reaction immunologique ou sp6cifique, 

les reactifs permettant la detection des complexes 
antigene-anticorps produits par la reaction immunologique 
Eventuellement presents dans 1 1 Echantillon biologique, et 
la mise en evidence in vitro des complexes antigene- 

30 anticorps eventuellement formes, ces reactifs pouvant 
egalement porter un marqueur, ou etre susceptibles d'etre 
reconnus a leur tour par un reactif marqu6, plus 
particulierement dans le cas ou le polypeptide selon 
1' invention n'est pas marque, 

35 - le cas 6cheant, un echantillon biologique de reference 
(temoin nEgatif) depourvu d' anticorps reconnus par un 
polypeptide selon 1' invent ion, 
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- le cas ech£ant, un 6chantillon biologique de r6f£rence 
(t£moin positif) contenant une quantity predetermine 
d' anticorps reconnus par un polypeptide selon 1' invention. 

5 Les polypeptides selon 1' invention permettent de 

preparer des anticorps monoclonaux ou polyclonaux 
caract6ris6s en ce qu'ils reconnaissent specif iquement les 
polypeptides selon I 1 invention. Les anticorps monoclonaux 
pourront avantageusement etre pr6par£s a partir 

10 d'hybridomes selon la technique dScrite par Kohler et 
Milstein en 1975. Les anticorps polyclonaux pourront etre 
prepares, par exemple par immunisation d'un animal, en 
particulier une souris, avec un polypeptide selon 
1' invention associe a un adjuvant de la reponse 

15 immunitaire, puis purification des anticorps spScifiques 
contenus dans le s6rum des animaux immunises sur une 
colonne d' affinity sur laquelle a prealablement 6t6 fixe le 
polypeptide ayant servi d'antigene. Les anticorps 
polyclonaux selon 1' invention peuvent aussi etre prepares 

20 par purification sur une colonne d' affinity, sur laquelle a 
prealablement et6 immobilise un polypeptide selon 
1* invention, des anticorps contenus dans le serum de 
patients infectSs par une mycobact6rie et 
pr6f erentiellement une bact§rie appartenant au complexe 

25 Mycobacterium tuberculosis. 

L ' invention a 6galement pour objet des anticorps mono 
ou polyclonaux ou leurs fragments, ou anticorps 
30 chimeriques, caract§ris€s en ce qu'ils sont capables de 
reconnaltre specif iquement un polypeptide selon 
1 ' invention . 

Les anticorps de 1' invention pourront egalement etre 
35 marques de la meme mani^re que dfecrit pr§c6demment pour les 
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sondes nucl6iques de 1' invention tel qu'un marquage de type 
enzymatique, fluorescent ou radioactif. 

L< invention vise en outre un proc§d£ pour la detection 
5 specif ique de la presence d ! un antig&ne d'une mycobact6rie 
et pr6f 6rentiellement un bact^rie du complexe Mycobacterium 

tuberculosis dans un 6chantillon biologique, caract§ris6 en 

ce qu'il comprend les Stapes suivantes : 

10 a) Mise en contact de 1 * echant illon biologique (tissu ou 
fluide biologique) pr61ev£ chez un individu avec un 
anticorps mono ou polyclonal selon 1' invention , dans des 
conditions permettant une reaction immunologique in vitro 
entre lesdits anticorps et les polypeptides spScifiques des 

15 mycobacteries et pref Srentiellement des bacteries du 
complexe de Mycobacterium tuberculosis 6ventuellement 

presents dans 1 ' Schantillon biologique, et 

b) Mise en evidence du complexe antigene-ant icorps f orm€ . 

20 Entre egalement dans le cadre de 1' invention, un 

n^cessaire ou kit pour le diagnostic in vitro sur un 

echantillon biologique, de la presence de souches de 
mycobacteries des mycobacteries et pref erentiellement des 
bacteries appartenant au complexe de Mycobacterium 

25 tuberculosis, de pr6f6rence M. tuberculosis, caract6ris€ en 

ce qu'il comprend : 

- un anticorps polyclonal ou monoclonal selon 1' invention, 
le cas £cheant marquS; 

- le cas echeant, un reactif pour la constitution du milieu 
30 propice & la realisation de la reaction immunologique; 

un reactif permettant la detection des complexes 
antig&ne-anticorps produits par la reaction immunologique, 
ce reactif pouvant §galement porter un marqueur, ou etre 
susceptible d'Stre reconnu a son tour par un r§actif 
35 marque, plus particulierement dans le cas oil ledit 
anticorps monoclonal ou polyclonal n'est pas marque. 
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- le cas 6ch6ant, des rSactifs pour effectuer la lyse des 
cellules de 1 * 6chantillon teste. 

La prSsente invention a fegalement pour objet un 
5 proc6d6 de detection et d' identification rapide des 
mycobacterias et pr6f 6rentiellement des bactSries de M. 
tuberculosis dans un echantillon biologique, caract6ris£ 

en ce qu'il comporte les Stapes suivantes : 

a) Isolement de l'ADN a partir de 1 1 6chant illon 
U) biologique H analyser, ou obtention d'un ADNc S partir de 

1 1 ARN de 1 1 echantillon biologique ; 

b) Amplification sp£cifique de l'ADN des mycobacteries et 
pr£f erentiellement des bacteries appartenant au complexe 
Mycobacterium tuberculosis a l'aide d 1 amorces selon 

15 1' invent ion; 

c) Analyse des produits d* amplification. 

Le produits d' amplification peuvent etre analyses par 
differentes methodes. 
20 Deux m£thodes d' analyse sont donn£es a titre d'exemple 

ci-dessous : 

Analyse electrophoretique en gel d l agarose des 
produits d' amplification. La presence d'un fragment d'ADN 
migrant a l'endroit attendu suggere que 1 ' echantillon 
25 analyst contenait de l'ADN de mycobacteries appartenant au 
complexe tuberculosis, ou 

- Analyse par la technique d 1 hybridation mol6culaire 
en utilisant une sonde nucl€ique selon 1' invention. Cette 
sonde sera avantageusement marquee par un element non 
30 radioactif (sonde froide) ou radioactif. 

Aux fins de la presente invention, on entendra par 
« ADN de 1* echantillon biologique » ou « ADN contenu dans 
1 1 echantillon biologique », soit l'ADN present dans 
35 1 echantillon biologique considere, soit I'ADNc obtenu 
apr£s 1' action d'une enzyme de type transcriptase inverse 
sur l'ARN present dans ledit echantillon biologique. 
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Un autre procEdE de la prSsente invention permet la 
detection d'une infection par une mycobactErie et 
5 prEfErentiellement une bactErie du complexe Mycobacterium 

tuberculosis dans un mammifere. Ce procEdE comprend les 

Stapes suivantes : 

a) preparation d'un Echantillon biologique contenant des 
cellules dudit mammifere plus particulierement des cellules 

10 du systeme immunitaire dudit mammifere et plus 
particulierement encore des cellules T ; 

b) incubation de 1 .' echantillon biologique de I'etape a) avec 
un polypeptide selon 1' invention; 

c) detection d'une reaction cellulaire indiquant une 
15 sensibilisation prealable du mammifere audit polypeptide 

notamment la proliferation cellulaire et/ou la synthese de 
protEines telles que 1' interferon gamma; 

d) detection d'une reaction d ' hypersensibilitE retardee ou 
de sensibilisation du mammifere audit polypeptide. 

20 

Cette methode de detection est une methode 
intradermique, qui est decrite par exemple par M. J. Elhay 
et al. (1988) Infection and Immunity, 66(7) : 3454-3456. 

25 Un autre but de la prEsente invention consiste en un 

procede pour la detection des mycobactEries et 
prEf Erentiellement des bactEries appartenant au complexe 
Mycobacterium tuberculosis dans un Echantillon biologique, 
caractErisE en ce qu'il comprend les Stapes suivantes : 
30 a) Mise en contact d'une sonde oligonuclEotidique selon 
1' invention avec un Echantillon biologique, l'ADN contenu 
dans 1 1 Echantillon biologique, ou l'ADNc obtenu par 
transcription inverse de l'ARN de 1 1 echantillon biologique, 
ayant, le cas EchEant, prealablement EtE rendu accessible a 
35 1 ! hybridation, dans des conditions permettant 1 1 hybridation 
de la sonde & l'ADN ou l'ADNc des mycobactEries et 
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pref erentiellement des bacteries du complexe Mycobacterium 
tuberculosis; 

b) Detection de l'hybride forme entre la sonde 
oligonucleotidique et 1 1 ADN de 1 1 echantillon biologique. 

5 

L 1 invention vise egalement un proc6d6 pour la detection 
des mycobacteries et pr6f erentiellement des bacteries 
appartenant au complexe Mycobacterium tuberculosis dans un 

echantillon biologique, caract6ris£ en ce qu'il comprend 
10 les etapes suivantes : 

a) Mise en contact d'une sonde oligonucleotidique selon 
l 1 invention immobilisee sur un support, avec un 
echantillon biologique, l'ADN de 1 1 echantillon biologique 
ayant, le cas £ch£ant, ete prealablement rendu accessible a 

15 1 'hybridation, dans des conditions permettant 1 1 hybridation 
de ladite sonde a l'ADN des mycobacteries et 
pref erentiellement des bacteries du complexe Mycobacterium 

tuberculosis; 

b) Mise en contact de l'hybride forme entre ladite sonde 
20 oligonucleotidique immobilisee sur un support et l'ADN 

contenu dans 1 ' echantillon biologique, le cas Scheant apres 
elimination de l'ADN de 1 1 echantillon biologique n 1 ayant 
pas hybrid^ avec la sonde, avec une sonde 
oligonucleotidique marquee selon 1' invention. 

25 

Selon un mode de realisation avantageux du procede de 
detection defini prScedemment , celui-ci est caracterise en 
ce que, prealablement a I'etape a), l'ADN de 1 1 echantillon 
biologique est prealablement amplifie a l'aide d'un couple 
30 d' amorces selon 1' invention. 

Une autre forme de mise en oeuvre du procede de 
detection selon 1' invention consiste en un procede pour la 
detection de la presence des mycobact§ries et 
35 pref erentiellement des bacteries appartenant au complexe de 
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Mycobacterium tuberculosis dans un echantillon biologique, 
caractErisE en ce qu'il comprend les Stapes suivantes : 

a) Mise en contact de 1 ' Echantillon biologique avec un 
5 couple d' amorces selon 1 1 invention, l'ADN contenu dans 

1 1 Echantillon ayant EtE, le cas EchEant, prealablement 
rendu accessible & 1 ' hybridation, dans des conditions 
permettant une hybridation desdites amorces a l'ADN des 
mycobactEries et prEf Erentiellement des bactEries du 
10 complexe Mycobacterium tuberculosis; 

b) Amplification de l'ADN d'une mycobactErie et 
prEf Erentiellement d'une bacterie du complexe Mycobacterium 

tuberculosis; 

15 

c) mise en evidence de 1 1 amplification de fragments d'ADN 
correspondant au fragment encadre par les amorces, par 
exemple par Electrophorese sur gel ou au moyen d'une sonde 
oligonucleotidique selon invention. 

20 

L' invention a aussi pour objet un procede pour la 
detection de la presence des mycobactEries et 
prEf Erentiellement des bactEries appartenant au complexe de 
Mycobacterium tuberculosis dans un Echantillon biologique 

25 par deplacement de brin, caractErisE en ce qu'il comprend 
les Etapes suivantes : 

a) Mise en contact de 1 ' Echantillon biologique avec deux 
couples d 1 amorces selon 1' invention specif iquement 
destinees k 1 ' amplification de type SDA decrites ci-dessus, 
30 l'ADN contenu dans 1 1 Echantillon ayant EtE, le cas EchEant, 
prEalablement rendu accessible a 1 1 hybridation, dans des 
conditions permettant une hybridation des amorces a 1 1 ADN 
des mycobactEries et pref Erentiellement des bactEries du 
complexe Mycobacterium tuberculosis; 
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b) amplification de l'ADN des mycobacteries et 
pr§f erent iellement des bacteries du complexe Mycobacterium 

tuberculosis ; 

c) mise en Evidence de 1 ' amplification de fragments d'ADN 
5 correspondant au fragment encadrS par les amorces, par 

exemple par eiectrophorese sur gel ou au moyen d'une sonde 
oligonuclSotidique selon l 1 invention. 

L' invention concerne aussi un necessaire ou kit pour 
K) la mise en oeuvre du procede decrit ci-dessus, destine a la 
detection de la presence des mycobacteries et 
pref erentiellement des bacteries du complexe Mycobacterium 

tuberculosis dans un echantillon biologique, caracterise en 

ce qu'il comprend les elements suivants : 
15 a) Une sonde oligonucleotidique selon 1' invention; 

b) Les reactifs necessaires a la mise en oeuvre d'une 
reaction d 1 hybridation ; 

c) Le cas echeant, un couple d 1 amorces selon 1' invention 
ainsi que les reactifs necessaires a une reaction 

20 d' amplification de l'ADN (ADN genomique, ADN plasmidique ou 
ADNc) des mycobacteries et pr£f erent iellement des bacteries 
du complexe Mycobacterium tuberculosis. 

L 1 invention a aussi pour objet un kit ou necessaire 
25 pour la detection de la presence des mycobacteries et 
pref erentiellement des bacteries du complexe Mycobacterium 

tuberculosis dans un echantillon biologique, caracterise en 

ce qu ! il comprend les elements suivants : 

a) Une sonde oligonucleotidique, dite sonde de capture, 
30 selon 1' invention; 

b) Une sonde oligonucleotidique, dite sonde de 
r^v^lation, selon 1' invention. 

c) Le cas echeant, un couple d ! amorces selon 1' invention 
ainsi que les reactifs necessaires a une reaction 

35 d' amplification de l'ADN des mycobacteries et 



WO 99/09186 



PCT/FR98/01813 



57 



pr£f £rentiellement des bacteries du complexe Mycobacterium 
tuberculosis . 

V invention concerne encore un kit ou nEcessaire pour 
5 1 ' amplification de l'ADN des mycobacteries et 
prSf erentiellement des bactgries du complexe Mycobacterium 

tuberculosis present dans un £chantillon biologique, 

caracterise en ce qu'il comprend les Elements suivants : 

10 a) Un couple d 1 amorces selon 1* invent ion; 

b) Les reactifs nEcessaires pour effectuer une reaction 
d ' amplification d'ADN; 

c) Eventuellement un composant permettant de verifier la 
sequence du fragment amplifi6, plus particulierement une 

15 sonde oligonucleotidique selon 1' invention. 



Un autre objet de la presente invention concerne une 
composition immunogene, caracterisee en ce qu'elle comprend 
un polypeptide selon 1' invention. 

20 

Une autre composition immunogene selon 1* invention est 
caracteris§ en ce qu'elle comprend un ou plusieurs 
polypeptides selon 1* invention et/ou un ou plusieurs 
polypeptides hybrides selon l 1 invention. 

25 

Selon un mode de realisation avantageux, la 
composition immunogene ci-dessus definie est constitutive 
d'un vaccin, lorsqu'elle est pr€sentee en association avec 
un v€hicule pharmaceutiquement acceptable et Eventuellement 
30 un ou plusieurs adjuvants de 1' immunity tels que 1 1 alun ou 
un representant de la famille des muramyl peptides ou 
encore l f adjuvant incomplet de Freund. 



Aujourd'hui, divers types de vaccins sont disponibles 
35 pour proteger l'homme contre des maladies infectieuses : 
micro-organismes vivants attenu€s (M. bovis - BCG pour la 
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tuberculose) , micro-organismes inactiv£s (virus de la 
grippe) , des extraits acellulaires (Bordetella pertussis 

pour la coqueluche) , prolines recombin^es (antigene de 
surface du virus de 1 ! hepatite B) , des polyosides 

5 (pneumocoques) . Des vaccins pr6par£s & partir de peptides 
de synthese ou de micro-organismes g6n6t iquement modifies 
exprimant des antig&nes h6terologues sont en cours 
d ' experimentation . Plus r^cemment encore, des ADN 
plasmidiques recombin^s portant des genes codant pour des 

10 antigenes protecteurs ont et£ proposes comme stratSgie 
vaccinale alternative, Ce type de vaccination est realise 
avec un plasmide particulier d£rivant d'un plasmide de E. 

coli qui ne se rSplique pas in vivo et qui code 

uniquement pour la proteine vaccinante, Les principaux 
15 composants fonctionnels de ce plasmide sont : un promoteur 
fort permettant 1' expression dans les cellules eucaryotes 
(par exemple celui du CMV) , un site de clonage approprie 
pour inserer le gene d'interet, une sequence de 
terminaison-polyadenylation, une origine de replication 
20 procaryote pour produire le plasmide recombine in vitro 

et un marqueur de selection (par exemple le gene de 
resistance & 1 ' ampicilline) pour faciliter la selection 
des bacteries qui contiennent le plasmide. Des animaux ont 
£t£ immunises en injectant simplement l'ADN plasmidique nu 
25 dans le muscle* Cette technique conduit a 1' expression de 
la protSine vaccinale in situ et a une rSponse 

immunitaire en particulier de type cellulaire (CTL) et de 
type humoral (anticorps) . Cette double induction de la 
r£ponse immunitaire est I'un des principaux avantages de 
30 la technique de vaccination avec de l'ADN nu. Huygen et 
al. (1996) et Tascon et al . (1996) ont r£ussi a obtenir 
une certaine protection contre M. tuberculosis en 

injectant des plasmides recombines contenant des g&nes de 
M. leprae (hsp65, 36kDa pra ) comme inserts, M. leprae 

35 est 1' agent responsable de la lepre. L ' utilisation d'un 
insert specifique de M. tuberculosis comme par exemple 
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tout ou partie du gene DP428, objet de la presente 

invention conduirait probablement a une meilleure 
protection contre la tuberculose. Tout ou partie du gene 
DP428, ou tout polynucleotide selon 1' invention, peut etre 

5 facilement ins6r£ dans les plasmides vecteurs VlJ 
(Montgomery et al, 1993), pcDNA3 (Invitrogen, R&D 
Systems) ou pcDNAl/Neo (Invitrogen) qui possedent les 
caracterist iques n6cessaires pour une utilisation 
vaccinale . 

10 

L' invention vise ainsi un vaccin, caracterisee en ce 
qu'il comprend un ou plusieurs polypeptides selon 
1' invention et/ou un ou plusieurs polypeptides hybrides 
selon l 1 invention tels que precedemment definis en 
15 association avec un vehicule pharmaceut iquement compatible 
et, le cas echeant, un ou plusieurs adjuvants de 
l'immunite appropries. 

L' invention vise aussi une composition vaccinale 
20 destinSe a 1 1 immunisation de 1 1 homme ou I 1 animal a 
I'encontre d'une infection bacterienne ou virale, telle que 
la tuberculose ou l 1 hepatite, caracterisee en ce qu'elle 
comprend un ou plusieurs polypeptides hybrides tels que 
precedemment definis en association avec un vShicule 
25 pharmaceut iquement compatible et, le cas echfeant, un ou 
plusieurs adjuvants de 1'immunite. 

Avantageusement , dans le cas d ! une prot^ine hybride 
entre un polypeptide selon 1' invention et l'antigene de 
30 surface de 1* hepatite B, la composition vaccinale sera 
administree, chez l 1 homme, a raison de 0,1 a 1 jig de 
prot^ine hybride purifiee par kilogramme du poids du 
patient, de preference 0,2 a 0,5 /xg/kg de poids du patient, 
pour une dose destinee a une administration donnee. Dans le 
35 cas de patients atteints de troubles du systeme 
immunitaire, en particulier les patients immunodSprimes, 
chaque dose injectee contiendra pref erentiellement la 
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moitie de la quantite ponderale de la protSine hybride 
contenue dans une dose destinee a un patient n ! 6tant pas 
affecte de troubles du systeme immunitaire . 

5 De preference, la composition vaccinale sera 

administr^e a plusieurs reprises, de manidre 6tal6e dans le 
temps, par voie intradermique ou sous-cutan£e . A titre 
d'exemple, trois doses telles que d6finies ci-dessus seront 
respectivement administrSes au patient au temps to, au 

10 temps to + 1 mois et au temps to + 1 an. 

Alternativement , trois doses seront respectivement 
administrees au patient au temps to, au temps to + 1 mois 
et au temps to + 6 mois. 

15 Che2 la souris, chez laquelle une dose ponderale de la 

composition vaccinale comparable a la dose utilis£e chez 
I'homme est administree, la reaction anticorps est testee 
par prelevement du serum suivi d'une etude de la formation 
d'un complexe entre les anticorps presents dans le serum et 

20 l'antigene de la composition vaccinale, selon les 
techniques usuelles. 

L' invention concerne egalement une composition 
immunogene caract£risee en ce qu 'elle comprend un 
25 polynucleotide ou un vecteur d 1 expression selon 
1' invention, en association avec un v6hicule permettant son 
administration a l'homme ou l 1 animal. 

L' invention a encore pour objet un vaccin destine a 
30 1 1 immunisation a l'encontre d'une infection bacterienne ou 
virale, telle que la tuberculose ou 1' hepatite, caracterise 
en ce qu'il comprend un polynucleotide ou un vecteur 
d' expression selon l 1 invention, en association avec un 
vShicule pharmaceutiquement acceptable. 

35 

De telles compositions immunogenes ou vaccinales sont 
notamment . .d€crites dans la demande internationale N° WO 
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90/11092 (Vical Inc.) et egalement dans la demande 
internationale N° WO 95/11307 {Institut Pasteur) . 

Le polynucleotide constitutif de la composition 
5 immunogene ou de la composition vaccinale selon l 1 invention 
peut etre injecte a 1 ' hote apres avoir ete couple a des 
composes qui favorisent la penetration de ce polynucleotide 
d l'int^rieur de la cellule ou son transport jusqu'au noyau 
cellulaire. Les conjugues resultants peuvent etre 
10 encapsuies dans des microparticules polymeres, comme decrit 
dans la demande internationale N° WO 94/27238 (medisorb 
Technologies International) . 

Selon un autre mode de realisation de la composition 
15 immunogene et/ou vaccinale selon 1' invention, le 
polynucleotide, de preference un ADN, est complexe avec du 
DEAE-dextran (Pagano et al., 1967) ou avec des proteines 
nucieaires (Kaneda et al., 1989), avec des lipides (Feigner 
et al., 1987) ou encore encapsuies dans des liposomes 
20 (Fraley et al . , 1980). 

Selon encore un autre mode de realisation avantageux 
de la composition immunogene et/ou vaccinale selon 
1* invention, le polynucleotide selon 1' invention peut etre 

25 introduit sous la forme d ! un gel facilitant sa trans feet ion 
dans les cellules, Une telle composition sous forme de gel 
peut etre un complexe de poly-L- lysine et de lactose, comme 
decrit par Midoux en 1993, ou encore le Poloxamer 407™, 
comme decrit par Pastore en 1994. Le polynucleotide ou le 

30 vecteur selon 1' invention peuvent aussi etre en suspension 
dans une solution tampon ou etre associes a des liposomes. 

Avantageusement , un tel vaccin sera prepare 
conformement a la technique decrite par Tacson et al, ou 
35 Huygen et al . en 1996 ou encore conformement a la technique 
decrite par Davis et al . dans la demande internationale N° 
WO 95/11307 (Whalen et al.). 
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Un tel vaccin sera avantageusement prepare sous la 
forme d'une composition contenant un vecteur selon 
1' invention, placSe sous le controle d' elements de 
regulation permettant son expression chez 1 1 homme ou 
5 l 1 animal. 

Pour r£aliser un tel vaccin, le polynucleotide selon 
1' invention est tout d'abord sous-clone dans un vecteur 
d' expression approprie, plus particulierement un vecteur 
K) d 1 expression contenant des signaux de regulation et 
d' expression reconnus par les enzymes des cellules 
eucaryotes et contenant egalement une origine de 
replication active chez les procaryotes, par exemple chez 
E. coli, qui permet son amplification prealable. Puis le 

15 plasmide recombinant purifie obtenu est injecte a l'hote, 

par exemple par voie intramusculaire . 

On pourra par exemple utiliser, en tant que vecteur 

d 1 expression in vivo de l'antig£ne d'interet, le plasmide 

pcDNA3 ou le plasmide pcDNAl/neo, tous les deux 
20 commercialises par Invitrogen (R&D Systems, Abingdon, 

Royaume-Uni) . On peut aussi utiliser le plasmide VlJns.tPA, 

decrit par Shiver et al. en 1995. 

Un tel vaccin comprendra avantageusement, outre le 

vecteur recombinant, une solution saline, par exemple une 
25 solution de chlorure de sodium. 

Une composition vaccinale telle que d6finie ci-dessus sera 
par exemple administree par voie parenterale ou par voie 
intramusculaire . 

30 

La presente invention concerne egalement un vaccin 
caracterise en ce qu'il contient une ou plusieurs sequences 
nucieotidiques selon l 1 invention et/ou un ou plusieurs 
polynucleotides tel que mentionne ci-dessus en association 
35 avec un vehicule pharmaceutiquement compatible et, le cas 
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£cheant, un ou plusieurs adjuvants de l'immunite 
appropri^s . 

Un autre aspect porte sur une m6thode de criblage de 
5 molecules capables d'inhiber la croissance de mycobact6ries 
ou le maintien de mycobact£ries dans un hote, caracteris6e 
en ce que lesdites molecules bloquent la synthase ou la 
fonction des polypeptides codSs par une sequence 
nucl£otidique selon 1' invention ou par un polynucleotide 
10 tel que decrit supra. 

Dans ladite methode de criblage, les molecules peuvent 
§tre des anti-messagers ou peuvent induire la synthese 
d ' anti-messagers . 

15 

La presente invention vise egalement des molecules 
capables d'inhiber la croissance de mycobact£ries ou le 
maintien de mycobact^ries dans un hote, caract£ris£es en ce 
que lesdites molecules sont synthetis^es d'apres la 
20 structure des polypeptides codes par une sequence 
nucleotidique selon 1 ! invention ou par un polynucleotide 
tel que d6crit supra. 

D'autres caract^ristiques et avantages de 1' invention 
25 apparaissent dans les exemples et les figures suivants : 

FIGURES 

30 La serie de Figures 1 : 

La sSrie de Figures 1 illustre la sSrie de sequences 
nucl6otidiques SEQ ID N°l correspondant §. 1* insert du 
vecteur pDP428 (deposS a la CNCM sous le N° 1-1818) et 
35 la serie de sequences d'acides amines SEQ ID N°l des 



WO 99/09186 



PCT/FR98/01813 



64 

polypeptides codes par la serie des sequences 
nuclSotidiques SEQ ID N°l. 

Figure 2 : 

5 

Illustre la sequence nucl6otidique SEQ ID N°2 
correspondant a la region incluant le gene codant pour 
le polypeptide DP428 (region soulign£e) . Sur cette 
figure ont §t6 pris en compte a la fois' les codons ATG 

10 et GTG d* initiation de la traduction. La figure fait 
apparaitre que le polypeptide DP428 fait probablement 
partie d'un op6ron comprenant au moins trois genes. La 
region doublement encadree inclut probablement les 
regions promotrices. 

15 La region simplement encadree correspond au motif LPISG 
rapellant le motif LPXTG decrit chez les bact6ries a 
Gram positifs comme permettant 1 * ancrage aux 
peptidoglycannes . 

20 La serie de Figures 3 : 

La serie de Figures 3 represente la s6rie de sequences 
nucl^otidiques SEQ ID N°3 correspondant a 1' insert du 
vecteur p6D7 (d£pos<§ a la CNCM sous le N° 1-1814) . 

25 

La s6rie de Figures 4 : 

La serie de Figures 4 repr€sente la s€rie de sequences 
nucl^otidiques SEQ ID N°4 correspondant a 1' insert du 
30 vecteur p5A3 (d£pos6 a la CNCM sous le N° 1-1815. 

La s6rie de Figures 5 : 

La s&rie de Figures 5 represente la serie de sequences 
35 nucleotidiques SEQ ID N°5 correspondant a 1 ' insert du 
vecteur p5F6 (d6pos£ a la CNCM sous le N° 1-1816) . 
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La serie de Figures 6 



5 



10 



15 



20 



25 



La serie de Figures 6 represente la serie de sequences 
nucleotidiques SEQ ID N°6 correspondant a 1 ' insert du 
vecteur p2A29 (depose a la CNCM sous le N° 1-1817) . 



La serie de Figures 7 : 

La serie de Figures 7 represente la serie de sequences 
nucleotidiques SEQ ID N°7 correspondant a 1 • insert du 
vecteur p5B5 (depose a la CNCM sous le N° 1-1819) . 

La serie de Figures ft ! 

La serie de Figures 8 represente s6rie de sequences 
nucleotidiques SEQ ID N°8 correspondant a 1 ' insert du 
vecteur plC7 (depose a la CNCM sous le N° 1-1820). 

La serie de Figures 9 ; 

La serie de Figures 9 represente la serie de sequences 
nucleotidiques SEQ ID N°9 correspondant a 1 • insert du 
vecteur p2D7 (depose a la CNCM sous le N° 1-1821). 

La serie de Figures 10 : 

La serie de Figures 10 represente la serie de sequences 
nucleotidiques SEQ ID N°10 correspondant a 1' insert du 
vecteur plB7 (depose a la CNCM sous le N° 1-1843) . 

30 La serie de Figures 11 : 

La serie de Figures 11 represente la serie de sequences 
nucleotidiques SEQ ID N°ll. 



35 La serie de Figures 12 
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La serie de Figures 12 represente la serie de sequences 
nucleotidiques SEQ ID N°12. 

La serie de Figures 13 : 

5 

La s6rie de Figures 13 represente la serie de sequences 
nucleotidiques SEQ ID N°13. 

La serie de Figures 14 : 

10 

La serie de Figures 14 represente la serie de sequences 
nucleotidiques SEQ ID N°14 correspondant a 1 • insert du 
vecteur p5B5 (depose a la CNCM sous le N° 1-1819) . 

15 

La serie de Figures 15 : 

La serie de Figures 15 represente la serie de sequences 
20 nucleotidiques SEQ ID N°15. 

La serie de Figures 16 : 

La serie de Figures 16 represente la serie de sequences 
25 nucleotidiques SEQ ID N°16. 

La serie de Figures 17 : 

La serie de Figures 17 represente la s6rie de sequences 
30 nucleotidiques SEQ ID N°17. 

La serie de Figures 18 : 

La serie de Figures 18 represente la serie de sequences 
35 nucleotidiques SEQ ID N°18, 

La serie- de Figures 19 : 
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La s&rie de Figures 19 represente la sSrie de sequences 
nucleotidiques SEQ ID N°19. 

5 La s£rie de Figures 20 : 

La s£rie de Figures 20 represente la s£rie de sequences 
nucleotidiques SEQ ID N°20 correspondant a 1' insert du 
vecteur p2A29 (depose a la CNCM sous le N° 1-1817) . 

K) 

La serie de Figures 21 : 

La serie de Figures 21 represente la serie de sequences 
nucleotidiques SEQ ID N°21. 

15 

La serie de Figures 22 : 

La serie de Figures 22 represente la serie de sequences 
nucleotidiques SEQ ID N°22. 

20 

La serie de Figures 23 : 

La serie de Figures 23 represente la serie de sequences 
nucleotidiques SEQ ID N°23. 

25 

La s6rie de Figures 24 : 

La serie de Figures 24 represente la serie de sequences 
nucleotidiques SEQ ID N°24. 

30 

Figures 25 et 26 : 

Les figures 25 et 26 illustrent respectivement les 
sequences SEQ ID N°25 et SEQ ID N°26 repr6sentant un 
couple d 1 amorces utilisees pour amplifier 
35 specif iquement par PCR la region correspondant aux 
nucleotides 964 a 1234 inclus dans la sequence SEQ ID 
N°l. 
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La serie de Figures 27 r 

La sdrie de Figures 27 represente la serie de sequences 
5 nucleotidiques SEQ ID N°27 correspondant a 1 ' insert du 
vecteur p5A3 . 

Figure 28 : 

0 La sequence d'acides amines telle que definie dans la 
figure 28 represente la sequence d'acides amines SEQ ID 
N°28 correspondant au polypeptide DP428. 



15 Figure 2 9 : 

La figure 29 represente la sequence nucleotidique SEQ ID N° 
29 du gene complet codant pour la proteine M1C25. 

20 Figure 30 : 

La figure 30 represente la sequence d'acides amines SEQ ID 
N° 30 de la proteine M1C25. 

25 La s6rie de Figures 31 : 

La sSrie de Figures 31 represente la sSrie de sequences 
nucleotidiques SEQ ID N°31. 

30 La serie de Figures 32 : 

La serie de Figures 32 represente la serie de sequences 
nucleotidiques SEQ ID N°32. 



35 La serie de Figures 33 
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La serie de Figures 33 represente la serie de sequences 
nucleotidiques SEQ ID N°33. 

La serie de Figures 34 : 

5 

La s6rie de Figures 32 represente la s£rie de sequences 
nucleotidiques SEQ ID N°34. 

La s6rie de Figures 35 : 

10 

La s£rie de Figures 35 represente la serie de sequences 
nucleotidiques SEQ ID N°35. 



15 

La serie de Figures 3 6 : 

La serie de Figures 36 represente la serie de sequences 
nucleotidiques SEQ ID N°36. 

20 

La serie de Figures 37 : 

La serie de Figures 37 represente la serie de sequences 
nucleotidiques SEQ ID N°37. 

25 

La serie de Figures 38 : 

La serie de Figures 38 represente la serie de sequences 
nucleotidiques SEQ ID N°38. 

30 

La serie de Figures 39 : 

La serie de Figures 3 9 represente la serie de sequences 
nucleotidiques SEQ ID N°39. 

35 

La serie de Figures 40 : 
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La s6rie de Figures 40 represente la s£rie de sequences 
nucleotidiques SEQ ID N°40. 

La s6rie de Figures 41 : 

5 

La s6rie de Figures 41 represente la s£rie de sequences 
nucleotidiques SEQ ID N°41 correspondant a 1' insert du 
vecteur p2D7 (depose a la CNCM sous le N°I-1821) . 

10 La serie de Figures 42 : 

La serie de Figures 42 represente la serie de sequences 
nucleotidiques SEQ ID N°42. 

15 

La serie de Figures 43 : 

La serie de Figures 43 represente la serie de sequences 
20 nucleotidiques SEQ ID N°43. 

La serie de Figures 44 : 

La serie de Figures 44 represente la sferie de sequences 
25 nucleotidiques SEQ ID N°44 . 

La serie de Figures 45 : 

La serie de Figures 45 represente la serie de sequences 
30 nucleotidiques SEQ ID N°45. 

La serie de Figures 46 : 

La serie de Figures 46 represente la s6rie de sequences 
35 nucleotidiques SEQ ID N°46. 



La serie de Figures 47 
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La s6rie de Figures 4 7 repr^sente la serie de sequences 
nucleotidiques SEQ ID N°47. 

5 La s£rie de Figures 4 8 : 

La s6rie de Figures 4 8 repr£sente la serie de sequences 
nucleotidiques SEQ ID N°48. 

It) La serie de Figures 4 9 : 

La serie de Figures 4 9 reprSsente la serie de sequences 
nucleotidiques SEQ ID N°49. 

15 

La serie de Figures 50 : 

La s6rie de Figures 50 represente la serie de sequences 
nucleotidiques SEQ ID N°50. 

20 

Figure 51 : 

A. la construction pJVED: Plasmid navette ( pouvant se 
multiplier chez les mycobacteries ainsi que chez 

25 E.coli) . avec un gene de resistance S la kanamycine 
(issu de Tn903) comme marqueur de selection. Le gdne 
phoA tronqu6(A phoA) et le gene luc forment un operon 
synthetique, 

B. Sequence de la jonction entre phoA et luc. 

30 

Figure 51 : 

Hybridation g£nomique (Southern blot) de 1'ADN 
genomique de diff€rentes especes mycobacteriennes a 
35 l'aide d'une sonde oligonucleotidique dont la sequence 
est la . sequence comprise entre le nucleotide en 
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position nt 964 (extremite 5- de la sonde) et le 

nucleotide en position nt 1234 (extremite 3 ' de la 

sonde), extr£mit6s indues, de la sequence SEQ ID N°l. 

5 Figures 53 et 54 : 



Activites Luc et PhoA de M. smegma tie recombinant; 
contenant le pjvED avec different fragments 
nucleotidiques comme decrits en exemple. Les figures 52 
et 53 representent les resultats obtenus pour deux 
experiences distinctes realises dans les memes 



10 



conditions 



2(1 



15 

Figure 55 



Representation de 1 ' hydrophobicite (Kyte et Doolitle) 
de la sequence codante du polypeptide DP4 28 avec sa 
representation schematique. Le motif LPISG precede 
immediatement la region C-terminale hydrophobe. La 
sequence se termine par deux arginines. 

Figure 56 : 

Representation de 1 ' hydrophoicite (Kyte et Doolitle) de 
la sequence du polypeptide M1C25 de sequence d'acides 
amines SEQ ID N° 30. 

Figure 57 •. 



25 



30 



A- Gel d'acrylamide (12%) en condition denaturante d'un 
extrait bactSrien obtenu par sonication de bacteries E. 
coli M15 contenant le plasmide P M1C25 sans et apres 4 
heures d' induction par l'lPTG, colore au bleu de 
35 Comas sie. 
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ligne 1: Marqueur de masse molaire (Prestained SDS-PAGE 
Standards High Range MO-llAD(7/>) . 

ligne 2; Extrait bact£rien obtenu par sonication de 
5 bacteries E. coli M15 contenant le plasmide pMlC25 

sans induction par l'IPTG. 

ligne 3: Extrait bact£rien obtenu par sonication de 
bacteries E. coli M15 contenant le plasmide pMlC25 
it) apres 4 heures d' induction par l'IPTG. 

ligne 4: Marqueur de masse molaire (Prestained SDS-PAGE 
Standards Low Range BIO-RAD®) . 

15 

B- Western blot d'un gel semblable gel (acrylamide 12%) 
revele grace a l'anticorps penta-His commercialise par la 
societe Quiagen. 

20 ligne 1: representation du marqueur de masse molaire 
(Prestained SDS-PAGE Standards High Range MQJtAI )@J . 

ligne 2:extrait bacterien obtenu par sonication de 
bactSries E. coli M15 contenant le plasmide pMlC25 
25 sans induction par l'IPTG. 

ligne 3: extrait bactfirien obtenu par sonication de 
bactferies E. coli M15 contenant le plasmide pMlC25 

apres 4 heures d' induction par l'IPTG, 

30 

ligne 4 : representation du marqueur de masse molaire 
(Prestained SDS-PAGE Standards Low Range BIO-RAD®) 

La bande presente tres majoritairement dans les lignes 
35 correspondant aux bacteries induites par l'IPTG par rapport 
a celles-non induites par l'IPTG, comprise entre 34200 et 
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28400 daltons, correspond a l 1 expression de 1' insert M1C25 
clon6 dans le vecteur pQE-60 (Qiagen®) . 



5 En ce qui concerne les 16gendes des autres figures qui 

sont num6rot6es par un caractere alphanum^rique, chacune de 
ces autres figures represente la sequence nuclSot idique et 
la sequence d'acides amines de sequence SEQ ID dont la 
numerotation est identique au caractere alphanum£rique de 

10 chacune desdites figures. 

Les num6rotations alphanumeriques des figures 
repr£sentant les SEQ ID comportant un nombre suivi d'une 
lettre ont les significations suivantes : 

les numSrotations alphanumeriques prSsentant le meme 

15 nombre concernent une meme famille de sequence rattach£es a 
la sequence de r§f£rence SEQ ID dont la numerotation 
presente ce meme nombre et la lettre A ; 

- les lettres A, B et C pour une meme famille de sequences 
distinguent les trois phases de lecture possibles de la 

20 sequence nucleotidique SEQ ID de reference (A) ; 

- les lettres index£es par un prime (') signifient que la 
sequence correspond a un fragment de la sequence SEQ ID de 
reference (A) ; 

- la lettre D signifie que la sequence correspond a la 
25 sequence du gdne pr6dit par Cole et al . , 1998 ; 

- la lettre F signifie que la sequence correspond a la 
phase ouverte de lecture (ORF pour "Open Reading Frame 1 ' ) 
contenant la sequence "D" correspondante d'apres Cole et 
al., 1998 ; 

30 - la lettre G signifie que la sequence est une sequence 
prfidite par Cole et al., 1998, et presentant une homologie 
de plus de 70% avec la sequence SEQ ID de reference (A) ; 

- la lettre H signifie que la sequence correspond a la 
phase ouverte de lecture contenant la sequence "G" 

35 correspondante d'apres Cole et al., 1998 ; 

- la lettre R signifie que la sequence correspond a une 
sequence predite par Cole et al . , 1998, en amont de la 



WO 99/09186 



PCT/FR98/01813 



75 

sequence "D" correspondante et pouvant etre en phase avec 
la sequence "D" en raison d'erreurs de sequenpage 
possibles ; 

- la lettre P signifie que la sequence correspond a la 
5 phase ouverte de lecture contenant la sequence "R" 

correspondante ; 

- la lettre Q signifie que la sequence correspond a une 
sequence contenant les sequences "F" et "P" 
correspondantes . 

10 En ce qui concerne la famille de sequences SEQ ID N° 

4, 1 ' insert precedent phoA contient deux fragments non 

contigus sur le genome, SEQ ID 4 J et SEQ ID 4 A, et done 
issus d'un clonage multiple permettant 1' expression et 
1 'exportation de phoA. Ces deux fragments non contigus, les 

15 gSnes et les phases ouvertes de lecture qui les contiennent 
d'apres Cole et al., 1998 # sont importants pour 
1 'exportation d'un polypeptide antigene : 

- les lettres J, K et L distinguent les trois phases de 
lecture possibles de la sequence nucl£ot idique "J" 

20 correspondante ; 

- la lettre M signifie que la sequence correspond a la 
sequence predite par Cole et al . , 1998, et contenant la 
sequence SEQ ID N° 4J ; 

- la lettre N signifie que la sequence correspond a la 
25 phase ouverte de lecture contenant la sequence SEQ ID N° 

4M. 

En ce qui concerne la famille de sequences SEQ ID 
N° 45, la lettre Z signifie que la sequence correspond a la 
sequence d'un fragment clon€ fusionn§ avec phoA. 

30 Enfin, en ce qui concerne la famille de sequence SEQ 

ID N° 41, la lettre S signifie que la sequence correspond a 
une sequence predite par Cole et al . , 1998 et pouvant etre 
dans la meme phase de lecture que la sequence "D" 
correspondante, la lettre T signifiant que la sequence 

35 correspondante contient les sequences "F" et "S" 
correspondantes . 
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EXEMPLES 

Materiel et mSthodes 
Cultures bacteriennes, plasmides et milieux de cultures 

E. coli a etS cultive sur milieu liquide ou solide Luria- 
Bertani (LB) . M. smegma t is a ete cultive sur milieu liquide 
Middlebrook 7H9 (Difco) additionne de dextrose albumine 
(ADC), 0,2 % de glycerol et 0,05 % de Tween, ou sur milieu 
solide L. Si nScessaire, 1 • antibiotique kanamycine a ete 
rajoute a une concentration de 20 M g/ml- 1. Les clones 
bacteriens presentant une activite PhoA ont ete detectes 
sur de l'agar LB contenant du 5-bromo-4 -chloro-3-indolyle 
phosphate (X-P, a 40 jig/ml- 1) . 

Manipulation d'ADN et sequencage 

Les manipulations d'ADN et les analyses par 
20 Southern blot ont ete effectuees en utilisant les 
techniques standard (Sambrook et al . , 1989). Les sequences 
d'ADN double brun ont ete determines avec un kit de 
sequencage Tag Dye Deoxy Terminator Cycle (Applied 
Biosystems}, dans un Systeme 9600 GeneAmp PGR (Perkin- 
Elmer), et apres migration sur un systeme d- analyse ADN 
modele 373 (Applied Biosystems) . 

Constructions des plasmides 



15 



25 



30 



35 



Le plasmide pJVED a a 6t6 construit a partir de 
pLA71 , plasmide de transfert comportant le gene phoA 
tronque et place en phase avec BlaF. pLA7l a ete coupe avec 
les enzymes de restriction Kpnl et AfotI, retirant ainsi 
phoA sans toucher le promoteur de BlaF. Le gene luc codant 
pour la luciferase de luciole a ete amplifie a partir de 
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pGEM-luc et un site de liaison du ribosome a ete rajoute. 
phoA a ete amplifie a partir de pJEMll. Les fragments 
amplifies ont ete coupes avec Pstl et ligatures ensemble. 

Les oligodeoxynucieotides utilises sont les suivants : 

5 pPV.luc.Fw : 5 * GACTGCTGCAGAAGGAGAAGATCCAAATGG3 ' 
luc.Bw : 5 1 GACTAGCGGCCGCGAATTCGTCGACCTCCGAGG3 ' 
pJEM.phoA.Fw : 5 1 CCGCGGATCCGGATACGTAC3 ' 
phoA . Bw : 5 ' GACTGCTGCAGTTTATTTCAGCCCCAGAGCG3 ' . 

Le fragment ainsi obtenu a ete r£amplifie en 

10 utilisant les oligonucleotides complementaires de ses 
extr6mites, coupe avec Kpnl et AfotI, et integr^ dans pLA71 
coupe avec les memes enzymes. La construction resultante a 
et£ electroporee dans E. coli DH5a et M. smegmatis mc2 155. 
Un clone M. smegmatis §mettant de la lumiere et presentant 

15 une activite phoA a 6te s£lectionne et appeie pJVED/JblaF. 
L 1 insert a ete retire en utilisant BamHl et la construction 
refermee sur elle-meme, reconstruisant ainsi le pJVED a . 
Afin d'obtenir le pJVEDb,c/ le multisite de clonage a ete 
coupe avec Seal et Kpnl et referme en enlevant un (pJVEDfa) 

20 ou deux (pJVED c ) nucleotides du site SnaBI . Apres fusion 
six cadres de lecture ont pu ainsi etre obtenus. L 1 insert 
du pJVED/hsp!8 a ete obtenu par amplification en chaine par 

polymerase (ACP) de pPM1745 (Servant et al . , 1995) en 
utilisant des oligonucleotides de la sequence : 
25 18. Fw : 5 1 GTACCAGTACTGATCACCCGTCTCCCGCAC3 • 
18. Back : AGTCAGGTACCTCGCGGAAGGGGTCAGTGCG3 ' 

Le produit a 6te coupe avec Kpnl et Seal, et 

ligature a pJVEDa, coupe avec les memes enzymes, quittant 
ainsi le pJVED/hspia. 

30 

Le pJVED/P19kDa et le pJVED/erp furent construits en 
coupant avec BaMlI l 1 insert de pExp410 et pExp53 
respect ivement , et en les inserant dans le site BamHI du 
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10 



15 



20 



multisite de clonage de pJVED a . 
Mesure de l'activite phosphatase alkaline 

La presence d'activite est detectee par la couleur 
bleue des colonies croissant sur un milieu de culture 
contenant le substrat 5-bromo 4-chloro 3-indolyl phosphate 
(XP), puis 1' activity peut etre mesuree quantitativement de 
maniere plus precise de la facon suivante : 

M. smegmatia ont ete cultives dans un milieu LB 
additionnes de 0,05 % de Tween 80 (Aldrich) et de 
kanamycine (20 /zg/ml- 1) a 37<>c pendant 24 heures. 
L'activite de la phosphatase alkaline a ete mesuree par la 
methode de Brockman et Heppel (Brockman et al . , 1968) dans 
un extrait sonique, avec p-nitrophenylphosphate comme 
substrat de la reaction. La quantite de prolines a ete 
mesuree par essai Bio-Rad. L'activite phosphatase alkaline 
est exprimee en unite arbitraire (densite optique a 420 nm 
x #g de proteines- 1 x minutes- 1) . 

Mesure de l'activite lucif erase 



25 



30 



35 



M. smegmatis a ete cultive dans un milieu LB 
additionne de 0,05 % de Tween 80 (Aldrich) et de kanamycine 
(20 M g/ml- 1) a 37°C pendant 24 heures et utilise en pleine 
croissance exponentielle (DO a 600 nm comprise entre 0,3 et 
0,8). Les aliquots de suspensions bacteriennes ont ete 
brievement soniqugs et 1' extrait cellulaire a etg utilise 
pour mesurer l'activite de la lucif erase. 25 M l de 
1' extrait sonique ont ete melanges avec 100 M l de substrat 
(systeme d'essai lucif erase Promega) automat iquement dans 
un luminometre et la lumiere emise exprimee en ULR ou RLU 
(Unites Lumineuses Relatives). Les bacteries ont ete 
comptees par dilutions serielles de la suspension d'origine 
sur milieu agar LB kanamycine et l'activite de la 
luciferase exprimee en ULR/ [ig de proteines bacteriennes ou 
en ULR/103 bacteries. 
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Construction de banques g6nomiques de M. tuberculosis et 
de M. bovis-BCG 

5 Les banques ont 6t6 obtenues en utilisant 

essentiellement pJVED a ,b,c pr6c6demment dScrits. 

Preparation de macrophages issus de la moelle osseuse et 
infection par M. smegma tis recombinants 

to 

Les macrophages issus de la moelle osseuse ont 6te 
prepares comme decrits par Lang et al., 1991. En resumS, 
les cellules de la moelle osseuse ont 6te preleves du femur 
de souris C57BL/6 agee de 6 a 12 semaines (Iffa-Credo, 

15 France) . Les cellules en suspensions ont 6t6 lav^es et 
resuspendues dans du DMEM enrichi avec 10 % de sferum foetal 
de veau, 10 % de milieu L-cell conditionne et 2 mM de 
glutamine, sans antibiotiques . 106 cellules ont §t6 
ensemencees sur des plaques 24 puits Costar a fond plat 

20 dans 1 ml. Apres quatre jours a 37°C dans une atmosphere 
humide a 10 % de teneur en C02, les macrophages ont et6 
rinces et reincubes pendant deux S quatre jours 
supplementaires . Les cellules d'un puits controle ont €te 
lys6es avec du triton x 100 a 0,1 % dans 1 ' eau et les 

25 noyaux €num6r€s. Environ 5 x 105 cellules adhfirentes ont 
6te comptSes. Pour 1' infection, M. smegmatis portant les 

diff6rents plasmides a 6t6 cultiv6 en pleine phase 
exponentielle (D0600nm entre 0,4 et 0,8) et dilue jusqu'& 
une DO de 0,1 puis 10 fois dans un milieu pour macrophage. 
30 1 ml a 6t£ ajout£ & chaque puits et les plaques ont 6te 
centrifugees et incubSes quatre heures a 37°C. Apres trois 
lavages, les cellules ont 6te incubSes dans un milieu 
contenant de l'amykacine pendant deux heures. Apres trois 
nouveaux lavages, les cellules infectees adhSrentes ont 6te 
35 incubSes dans un milieu macrophage pendant une nuit. Les 
cellules ont ensuite 6te lys6es dans 0,5 ml de tampon de 



WO 99/09186 



PCT/FR98/01813 



80 

lyse (Promega) . 100 fil ont €t& soniques et la lumiere Smise 
a §t6 mesuree sur 25 pm. Simultanement , les bact^ries ont 
6t6 6num6r6es par fitalement sur L-agar-kanamycine (20 
/zg/ml* 1) . La lumiere 6mise est exprim£e en ULR/lO^ 
5 bact6ries. 

Analyses des banques de donn£es 

Les sequences nucl£otidiques ont 6t6 compar£es a 
10 EMBL et GenBank en utilisant l'algorithme PASTA et les 
sequences protSiques ont £te analysees par similitude 
grace aux banques de donnees PIR et Swiss Prot en utilisant 
l*algorithme BLAST . 

15 Exemple 1 : Les vecteurs pJVED 

Les vecteurs pJVED (Figure 51) sont des plasmides 
port ant un gene phoA tronque de E. coli depourvu de codon 

d ' initiation, de sequence signal et de sequence 
20 regulatrice. Le site multiple de clonage (SMC) permet 
1' insertion de fragments des genes codants pour 
d ! eventuelles protSines exportees ainsi que leurs sequences 
de regulation, Des lors, la proteine de fusion peut etre 
produite et presenter une activite phosphatase alcaline si 
25 elle est exportee. Seules les fusions en phase pourront 
etre product ives. Ainsi, le SMC a et6 modifiS de sorte que 
les fusions peuvent Stre obtenues dans six phases de 
lecture. En aval de phoA, le gene luc de la lucif^rase de 

luciole a 6t6 ins€r€. Le gene complet avec le codon 
30 d' initiation mais sans qu'aucun promoteur n'ait et£ utilise 
devrait ainsi s'exprimer avec phoA comme dans un op€ron 

synth^tique. Un nouveau site de liaison des ribosomes a 6t6 
insure huit nucleotides en amont du codon d 1 initiation de 
luc. Deux terminateurs transcriptionnels sont presents dans 

35 les vecteurs pJVED, un en amont du SMC et un second en aval 
de luc. Ces vecteurs sont des plasmides de transfert E. 
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col i-mycobacterium avec un gene de resistance a la 
kanamycine comme marqueur de selection. 

phoA et luc fonctionnent comme dans un op&ron, ma is 

5 2 'exportation est n4cessaire pour 1 ' activity phoA. 

Quatre plasmides ont 6t6 construits par insertion 
dans le SMC de fragments d'ADN d'origine diverse : 

Dans la premiere construction nomm6e pJVED/blaF, le 

fragment de 1,4 kb provient du plasmide deja decrit pLA7l 
10 (Lim et al . , 1995). Ce fragment issu du gene P-lactamase 
(blaF) de AL fortuitum D216 (Timm et al . , 1994) inclut le 

promoteur mute hyperactif, le segment codant pour 32 acides 
amines de la sequence signal et les 5 premiers acides 
amines de la proteine mature. Ainsi cette construction 
15 inclut le promoteur le plus fort connu chez mycobacterium 
et les 61£ments n6cessaires a 1 1 exportation de la proteine 
de la fusion phoA. Par consequent, on peut attendre de 

cette construction une forte emission de lumiere et une 
bonne activity phoA (cf figures 53 et 54) . 

20 Dans une deuxieme construction nommee pJVED/hsplS, 

un fragment de 1,5 kb a 6te clon6 a partir du plasmide deja 
d6crit pPM1745 (Servant et al., 1995). Ce fragment inclut 
les nucleotides codants pour les dix premiers acides amines 
de la proteine de choc thermique de 18 kb issue de 
25 Streptomyces albus (heat shock protein 18, HSP 18), le site 

de liaison du ribosome, le promoteur et, en amont, des 
sites rfegulateurs controlant son expression. Cette proteine 
appartient S la famille de alpha-crystalline de HSP a 
faible poids mol^culaire (Verbon et al . , 1992). Son 
30 homologue issu de M. leprae, l'antigene de 18 kDa, est d€ja 

connu pour etre induit durant la phagocytose par un 
macrophage murin de la lign6e cellulaire J-774 
(Dellagostinet al., 1995). Dans des conditions de culture 
standard, le pJVED/hspltf, montre une faible activity luc et 

35 aucune activity phoA (cf figures 53 et 54) , 
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Dans une troisieme construction, nommee 
pJVED/ P19kDa, 1 1 insert issu de pExp410 (Lim et al . , 1995) a 
€t€ coupe et clone dans le SMC de p JVED a - Ce fragment 
inclut les nucleotides codants pour les 134 premiers acides 
5 amines de la proteine connue de M. tuberculosis 19 kDa et 

de ses sequences rfigulatrices . Comme cela a pu etre mis en 
evidence, cette proteine est une lipoprot6ine glycosyiee 
(Garbe et al . , 1993 ; Herrmann et al., 1996). Sur les 
figures 53 et 54, on observe, pour cette construction, une 
10 bonne activity luc correspondant a un promoteur fort, mais 

l'activite phoA est la plus forte des quatre constructions. 

L'activite phoA elevee de cette proteine de fusion avec une 

lipoproteine s'explique par le fait qu'elle reste attachee 
a la paroi cellulaire par son extremite N-terminal. 
15 Dans la quatrieme et derniere construction nommee 

pJVED/erp l f insert provient de pExp53 (Lim et al . , 1995) et 

a §tfi clon§ dans le SMC de pJVED a . pExp53 est le plasmide 
initial selectionnfe pour son activity phoA et contenant une 
partie du gdne erp de M. tuberculosis qui code pour un 

20 antigene de 28 kDa. Ce dernier inclut la sequence signal, 
une partie de la proteine mature et, en amont du codon 
d* initiation, le site de liaison de ribosome. Le promoteur 
a ete cartographie. Une boite fer (iron box) putative du 
type fur est pr6sente dans cette region et encadre la 

25 region -35 du promoteur (Berthet et al . , 1995) . Comme 
pr6vu (figures 53 et 54) cette construction presente une 
bonne emission lumineuse et une bonne activity phoA. Le 

fait que cette proteine de fusion, contrairement a la 
fusion avec la lipoproteine de 19 kDa, ne semble pas 
30 attach€e a la paroi cellulaire n'exclut pas que la proteine 
native y soit associee. De plus, 1' extremite C- terminal de 
erp est absente de la proteine de fusion. 

Exemple 2 : Construction d'une banque d'ADN genomique de 
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M. tuberculosis dans les vecteurs pJVED s et identification 
d'un des membres de ces banques, (DP428) , induit au cours 
de la phagocytose par les macrophages murins derives de la 
moelle osseuse. 

Les differentes constructions sont testees pour 
leur capacite a ^valuer l'expression intracellulaire des 
genes identifies par l'expression de phoA. Dans cet 
objectif, l'activite 2uc est exprimee en URL pour 103 
bacteries en culture axenique et/ou dans des conditions 
intracellulars. L' induction ou la repression suivant la 
phagocytose par les macrophages murins derives de la moelle 
osseuse peut etre evaluee convenablement par la mesure des 
activites specif iques. Les resultats de deux experiences 
distinctes sont presentes dans le tableau 2. 

Le plasmide pJVED/hsplfl a ete utilise comme 
contrdle positif pour 1' induction durant la phase de 
croissance intracellulaire. Bien que 1' induction du 
promoteur par le chauffage de la bacterie a 42°C n'ait pas 
6te concluant la phagocytose de la bacterie conduit 
clairement a une augmentation de l'activite du promoteur. 
Dans toutes les experiences, l'activite 2uc intracellulaire 
a et^ fortement induite, augmentant de 20 a 100 fois 
l'activite basale initialement faible (Servant, 1995). 

Le plasmide pJVED/JblaF a ete utilise comme controle 
de la modulation non sp6cifique au cours de la phagocytose. 
De faibles variations ont pu etre mises en evidence, 
probablement dues a des changements de conditions de 
cultures. Quoi qu'il en soit, ces faibles variations ne 
sont pas comparables a 1' induction observee avec le 
plasmide pJVED/hspiS. 

Tous les membres de la banque d'ADN ont £te testes 
par mesure de l'activite du promoteur durant la croissance 
intracellulaire. Parmi eux, le DP428 est fortement induit 
au cours de la phagocytose (tableaux l et 2) . 
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TABLEAU 1 



Construction 


% Recuperation 


URL/10- 1 
bactcrics 
cxtraccllulaire 


URL/ 10* 
bactcrics 
intracellulaire 


Induction 


pj vtzUfoicir 




1HOU 






pj yCtXJfnspici 


U,0 


5 


r> / 


1 1 

7,1 


ni\/nr\//^/i 
pj VtiU//y/ -//o 






I 0 














Construction 


% Recuperation 
C57BL/6 Da!b/C 


URL/10 1 
bactcrics 
cxtraccllulaire 


URL/10 3 
bactcrics 
intracellulaire 
C57BL/6 Balb/C 


Induction 
C57DL/6 Balb/C 


pJVED/A/aF* 


7 1,1 


662 


250 911 


0,4 1,4 


pJVED//*.vp7S 


6 J 1,7 


164 


261 325 


1,6 2 


p}VEDIDP-t28 


1,6 2,1 


0,08 


L25 3,3 


15.6 41 



5 TABLEAU 2 



Construction 


% Recuperation 


URL/10 1 
bactcrics 
cxtracellulairc 


URL/ 10* 
bactcrics 
intracellulaire 


Induction 


pJVED/Wa/^ 


22 


1477 


367 


0,25 


pJVED/hspJ8 


7 


0,26 


6,8 


26 


pWEDIDP428 


21 


0,14 


4 


28 



Le fragment nucl^otidique codant pour la region N- 
terminale du polypeptide DP428 de sequence SEQ ID N° 28 est 
10 contenu dans le plasmide depose 3 la CNCM sous le N° I- 
1818. 

La totality de la sequence codant pour le polypeptide 
DP428 a 6t6 obtenue comme d6taill§e ci-apres. 

Une sonde a 6t€ obtenue par PCR a I'aide des 
15 oligonucl§otides de sequence SEQ ID N° 25 et SEQ ID N° 26. 
Cette sonde a 6t6 marquee par extension al^atoire en 
presence de 32 P dCTP. Une hybridation de l'ADN genomique de 
M. tuberculosis souche Mtl03 prealablement dig£re par 

1 ' endonucl§ase Seal a ete r§alisee a l'aide de ladite 
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sonde. Les r^sultats de 1 ' hybridation ont fait apparaitre 
qu'un fragment d'ADN d' environ 1,7 kb Stait marqu£. Du fait 
qu f il existe un site Seal attendant du nucleotide nt 984 
au nucleotide nt 989 de la sequence SEQ ID N° 1, e'est-a- 
5 dire du cot§ 5' de la sequence utilis6e comme sonde, la fin 
de la sequence codante est n£cessairement pr6sente dans le 
fragment d§tect6 par hybridation. 

L ! ADN g6nomique de la souche Mt 103 de M, 

tuberculosis, apres digestion par Seal, a subi une 

to migration sur un gel d* agarose. Les fragments de tailles 
comprises entre 1,6 et 1,8 kb ont £te clones dans le 
vecteur pSLllBO (Pharmacia) pr6alablement cliv§ par Seal et 
dephosphorylS . AprSs transformation de E. coli avec les 

vecteurs recombinants resultants, les colonies obtenues ont 
15 et§ criblees a l'aide de la sonde. Le criblage a permis 

d'isoler six colonies hybridant avec cette sonde. 

Les inserts contenus dans les plasmides des clones 

recombinants prec£demment select ionnSs ont 6te sequences, 

puis les sequences alignees de maniere a determiner la 
20 totalite de la sequence codant pour DP428, plus 

spdeif iquement la SEQ ID N° 2. 

Un couple d' amorces a 6te synth£tise afin d l amplifier, 

a partir de l'ADN g£nomique de M. tuberculosis, souche Mt 

103, la totality de la sequence codant pour le polypeptide 
25 DP428. L'amplicon obtenu a §t§ clon6 dans un vecteur 
d' expression. 

Des couples d 1 amorces appropri§s pour 1 1 amplification 
et le clonage de la s€quence codant pour le polypeptide 
DP428 peuvent etre aisSment realises par I'homme du metier, 
30 sur la base des sequences nuclSotidiques SEQ ID N°l et SEQ 
ID N°2. 

Un couple d' amorces particulier selon l l invention est 
le couple d 1 amorces suivants, capable d' amplifier l'ADN 
codant pour le polypeptide DP428 depourvu de sa sequence 
35 signal : 
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- Amorce aller (SEQ ID N° 29) , comprenant la sequence 
allant du nucleotide en position nt 1021 au nucleotide nt 
1044 de la sequence SEQ ID N° 2 : 

5' - AGTGCAT GCTGCTGGCCGAACCATC AGCGAC - 3' 

5 

- Amorce retour (SEQ ID N° 30), comprenant la sequence 
compiementaire de la sequence allant du nucleotide en 
position nt 1345 au nucleotide en position nt 1325 de la 
sequence SEQ ID N° 2 : 

11) 5' -CAGCCAGATCT GCGGGCGCCCTGCACCGCCTG - 3', 

dans lesquelles la partie soulignee represente les 
sequences hybridant specif iquement avec la sequence SEQ ID 
N° 2 et les extremites 5" correspondent a des sites de 
15 restriction en vue du clonage de l'amplicon resultant dans 
un vecteur de clonage et/ou d' expression . 

Un vecteur particulier utilise pour 1' expression du 
polypeptide DP428 est le vecteur pQE70 commercialise par la 
societe Qiagen. 

20 

Exemple 3 : La sequence complete du gene DP428 et de ses 
regions f lanquantes . 

Une sonde de la region codante de DP428 a ete 
25 obtenue par ACP, et utilisee pour hybrider l'ADN genomique 
de differentes espdces de mycobacteries . D'apres les 
resultats de la figure 3, le gene est present uniquement 
dans les mycobacteries du complexe de M. tuberculosis. 

L' analyse de la sequence suggere que DP428 pourrait 
30 faire partie d'un operon. La sequence codante et les 
regions flanquantes ne presentent aucune homologie avec des 
sequences connues deposees dans les banques de donnees. 

D'aprSs la sequence codante, ce gene code pour une 
proteine de 10 kDa avec un peptide signal, une extremite C- 
35 terminal hydrophobe terminee par deux arginines et precedee 
par un motif LPISG semblable au motif connu LPXTG. Ces deux 
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arginines pourraient correspondre a un signal de retention 
et la prot§ine DP428 pourrait etre accroch£e par ce motif a 
des peptidoglycanes comme cela a d6ja &t& decrit chez 
d'autres bact£ries Gram* (Navarre et al . , 1994 et 1996). 

5 Le m6canisme de survie et de croissance 

intracellulaire des mycobact^ries est complexe et les 
relations intimes entre la bact^rie et la cellule hote 
restent inexpliquSes . Quel que soit le m^canisme, la 
croissance et la survie intracellulaire des mycrobact^ries 

10 depend de facteurs produits par la bacterie et capables de 
moduler la rSponse de l'hote. Ces facteurs peuvent etre des 
molecules exposees a la surface cellulaire telle que LAM ou 
des proteines associees a la surface cellulaire, ou des 
molecules activement secrStees. 

15 D'un autre cotS, intracellulairement , les bacteries 

elles-memes doivent faire face a un environnement hostile. 
Elles semblent y r6pondre par des moyens proches de ceux 
mis en oeuvre dans les conditions de stress, par 
1* induction de proteines de choc thermique (Dellagostin et 

2<) al., 1995), mais aussi par induction ou la repression de 
differentes proteines (Lee et al . , 1995). En utilisant une 
mSthodologie dSrivee de la PGR, Plum et Clark-curtiss (Plum 
et al., 1994) ont montre qu'un gene de M. avium inclu dans 

un fragment d'ADN de 3 kb, est induit apres la phagocytose 
25 par des macrophages humains. Ce gene code pour une proteine 
exportie comprenant une sequence leader mais ne pr6sentant 
pas d'homologie significative avec les sequences proposees 
par les banques de donnSes . L' induction, pendant la phase 
de croissance intracellulaire, d'une prot§ine de choc 
30 thermique de faible poids moleculaire issue de M, leprae a 

£galement §t£ mise en evidence (Dellagostin et al . , 1995). 
Dans une autre Stude, les proteines bacteriennes de M. 

tuberculosis ont 6te m6taboliquement marquees pendant la 

phase de croissance intracellulaire ou bien dans des 
35 conditions de stress et separ£es par €lectrophorese sur gel 
a deux dimensions : 16 proteines de M. tuberculosis ont ete 
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induites et 28 reprimees. Les memes prolines sont mises en 
jeu au cours de stress provoqu6 par un faible pH, un choc 
thermique, H2O2, ou au cours de la phagocytose par des 
monocytes humains de la lign£e THP1 . Quoi qu'il en soit, le 

5 comportement des protfiines induites et r6prim6es 6tait 
unique dans chaque condition (Lee et al . , 1995). Pris 
ensemble, ces rSsultats indiquent qu'un dialogue 
molSculaire subtile est mis en place entre les bact§ries et 
leurs h6tes cellulaires. De ce dialogue depend probablement 

H) le sort de l'organisme intracellulaire . 

Dans ce contexte, 1' induct ion de 1' expression de 
DP428 pourrait etre d'une importance majeure, indiquant un 
role important de cette protSine dans la survie et la 
croissance intracellulaire. 

15 La m6thode utilis£e dans ces experiences pour 

^valuer 1' expression intracellulaire des genes (cf. Jacobs 
et al., 1993, pour la methode de determination de 
l'expression de la lucifSrase de luciole, et Lim et al . , 
1995, pour la m€thode de determination de 1' expression du 

20 gene PhoA) pr£sente 1 ' avantage d'etre simple compar£e aux 

autres techniques comme la technique d£crite par Mahan et 
al. (Mahan et al . , 1993) adaptee aux mycobactferies et 
propos£e par Bange et al. (Bange et al., 1996), ou la 
mSthode substractive bas£e sur l'ACP decrite par Plum et 
25 Clark-curtiss (Plum et al., 1994). II existe 
indiscutablement une variability comme le montre la 
comparaison des diff£rentes experiences. Bien que provoquer 
1' induction ou la repression soit suffisant, il est 
desormais possible de l ! 6valuer fournissant ainsi un outil 
30 supplement a ire d' etudes physiologiques des proteines 
exportees identifi£es par fusion avec phoA. 

Exemple 4 : 

Recherche d'une modulation de I'activite des promoteurs 
35 lors des phases intramacrophagiques . 



WO 99/09186 



PCT/FR98/01813 



89 

Des macrophages de moelle osseuse de souris sont 
prepares comme d6crit par Lang et Antoine (Lang et al., 
1991) . Les bact6ries de M. segmentis recombinantes, dont on 

a d6termin6 I 1 activity lucifSrase par 10 3 bactfiries comme 

5 pr£c6demment , sont incub6es a 3 7°C sous atmosphere 

humidifi6e et enrichie en CO2 a 5%, pendant 4 heures en 

presence de ces macrophages de telle manidre qu'elles 
soient phagocytics. Apr&s rinpage pour £liminer les 
bactSries extracellulaires restantes, on ajoute au milieu 

U) de culture de I'amikacine (100 /ig/ml) pendant deux heures. 
Apres un nouveau ringage, le milieu est remplace par un 
milieu de culture (DMEM enrichi de 10 % de s£rum de veau et 
2 mM de glutamine) sans antibiotiques . Apres une nuit 
d 1 incubation comme pr6cedemment , les macrophages sont lyses 

15 a froid (4°C) a l'aide d'un tampon de lyse (cee lysis 

buffer, Promega) , et l*activit£ lucif£rase par 10 3 
bacteries determin£e. Le rapport des activites a la mise en 
culture et apres une nuit donne le coefficient d 1 induction. 

20 Example 5 : 

Isolement d'une serie de sequences par sequencpage 
directement & partir des colonies. 

Une s6rie de sequences permettant 1' expression et 
25 1 i exportation de phoA ont €t§ isol€es a partir de l'ADN de 

M. Tuberculosis ou de M. Bovis BCG. Parmi ce groupe de 

sequences, deux d'entre elles ont €t6 d'avantage 6tudiees, 
les gdnes entiers correspondant aux inserts ont €t6 clones, 
s6quenc6s, et des anticorps contre le produit de ces genes 
30 ont servi a montrer en microscopie electronique que ces 
g&nes codaient pour des antigenes retrouv£s k la surface 
des bacilles de la tuberculose. L'un de ces genes erp 

codant pour une sequence signal d* exportation consensus, 
1' autre des ne possidait aucune caracteristique de g£ne 

35 codant pour une protfeine export€e, d' apres la sequence. Un 
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autre gene DP428 a 6te sequence avant que la sequence du 
genome de M. Tuberculosis ne soit disponible. II contient 

une sequence ressemblant a la sequence consensus 
d' attachement au peptidoglycane, ce qui suggere qu'il 
5 s'agit aussi d'un antigene vraisemblablement retrouv6 h la 
suface des bacilles de la tuberculose. L'6tude des trois 
g&nes erp # des, et celui codant pour DP428 montre que le 

systdme phoA que nous avons d6velopp6 chez les 

mycobact£ries permet de rep£rer des genes codant pour des 
10 prot£ine exportSes sans determinant reparable par des 
Etudes in silico. Ceci est particulierement vrai pour les 

polypeptides qui ne possedent pas de sequence signal 
consensus (des) ou non pas de similarity avec des prot£ines 

de fonction connue (erp et DP428) . 

15 

Un certain nombre d' inserts ont 6t£ identifies et 
s£quenc6s avant la connaissance du genome de M. 

Tuberculosis, d'autres apres. Ces sequences peuvent etre 

consider£es comme des amorces permettant de rechercher des 
20 genes codant pour des proteines exportees. A ce jour, une 
s£rie d' amorces ont £te sequenc£es et les g£nes entiers 
correspondants ont £t£ soit sequences, soit identifies 
d*apr£s la sequence publiee du genome. Pour tenir compte 
des erreurs de s£quen?age tou jours possibles, les regions 
25 en amont ou en aval de certaines amorces ont 6t£ 
consid£r£es comme pouvant faire partie de sequences codant 
pour des prot£ines export£es . Dans certains cas des 
similarity avec des genes codant pour des prot§ines 
export6es ou des sequences caract£ristiques de signaux 
30 d 1 exportation ou des caractSristiques topologiques de 
proteines membranaires ont et£ detectees. 

Des sequences amorces s'averent correspondre a des 
g&nes appartenant & des families de genes poss£dant plus de 
35 50 % de similarity. On peut ainsi indiquer que les autres 
genes d£tect£s par similarity avec une amorce codent pour 
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des prolines exportees. C'est le cas de la sequence SEQ ID 
N° 8G et SEQ ID N° 8H possddant plus de 77 % de similarity 
avec SEQ ID N° 8A' . 

Les sequences pouvant coder pour des prolines 
5 exportees sont les suivantes : SEQ ID N° 1, 8, 9, 8G # 8H, 
13, 3, 10, 19, 20, 6, 16, 22, 23, 24, 39, 44, 46, et 50. 

Des genes identifies d*apr6s les amorces d partir de 
la sequence du genome n'ont aucune caract6ristique (d'apr&s 
10 la sequence) de proteines exportees. II s'agit des 
sequences suivantes : SEQ ID N° 4, 27, 11, 12, 14, 7, 15, 
17, 18, 21, 31, 32, 33, 34, 35, 36, 37, 38, 40, 41, 42, 43, 
45, 47, 48, et 49. 

15 D'aprSs la sequence d'autres organismes comme £, coJi, 

on peut rechercher dans la sequence du genome de Af. 

tuberculosis , des genes poss^dant des similarites avec des 

proteines connues pour etre exportees chez d'autres 
organismes bien que ne poss€dant pas de sequence signal 
20 d' exportation. Dans ce cas une fusion avec phoA est un 

protocole avantageux pour determiner si ces sequences de M. 

tuberculosis codent pour des proteines exportees bien que 

ne pr6sentant pas de sequence signal consensus. 11 a 6t6 en 
effet possible de doner SEQ ID N° 49, une sequence 
25 similaire a un g&ne de E. coli de la famille hfcrA* Une 

fusion de SEQ ID N° 49 avec phoA conduit S 1' expression et 

a 1 1 exportation de phoA. Des colonies M. smegmatis 

h€bergeant une fusion SEQ ID N° 4 9 phoA sur un plasmide 

pJVED sont bleues. 
30 SEQ ID N° 49 est done consideree comme une prot6ine 

exportee . 

La methode phoA est done utile pour d£tecter d'aprSs 

la sequence de M. Tuberculosis des genes codant pour des 

proteines exportees sans qu'ils ne codent pour des 
35 sequences caracteristiques des proteines exportees. 
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M§me si une sequence possede des determinants de 
prolines exports, cela ne demontre pas une exportation 
fonctionnelle. Le systeme phoA permet de montrer que le 
gene suspecte code rSellement pour une proteine exportee. 
Ainsi, il a 6t6 verifie" que la sequence SEQ ID N° 50 
possSdait bien des signaux d 1 exportation . 

TABLEAU 3 



StsQ ID N 


Reference de la 
sequence 

correspondante predite 
par Cole et al . 




Annotation 


SEQ ID N°l 


Rv 0203 


* 


Sequence hydrophobe en 
N-terminal 


Z>£i\J 1U N H 

SEQ ID N°27 


Rv 2050 




Pas de prediction 


Qpa t r\ m ° Q 
OLU 1U N 0 

SEQ ID N°9 


Rv 2563 


* 


Proteine membranaire 


8G f ,H' 


Rv 0072 


* 


Possible proteine de 
transport transmembranaire 
de type ABC 


SEQ ID N°ll 


Rv 054 6c 


ML 


Protein S-D Lactoyl 
Glutathione-methyl 
glyoxal lyase 


SEQ ID N°12 


pas de prediction 




non retrouve dans 
M. tuberculosis H37rv 


SEQ ID N°13 
SEQ ID N°3 
SEQ ID N°10 


Rv 1984c 




probable precurseur 
cutinase avec une sequence 
signal N^termmale 


SEQ ID N°14 
SEQ ID N°7 


pas de prediction 




pas de prediction 


SEQ ID N°15 


avec d6calage de 
lecture, pourrait §tre 
en phase avec Rv 2530c 




pas de prediction 


SEQ ID N°17 


Rv 1303 


ML 


pas de prediction 


SEQ ID N°18 


Rv 0199 


ML 


pas de prediction 


SEQ ID N°19 


Rv 0418 




site de fixation de lipo- 
proteine membranaire 
procaryote, similarite avec 
la N-ac6tyl puromycyne 
acetyl hydrolase 


SEQ ID N°20 
SEQ ID N°6 


Rv 3576 




contient un site de 
fixation de lipoproteine 
membranaire procaryote, 
similarite avec une 
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serine/threonine proteine 
kinase 


SEQ ID N° 21 


Rv 3365c 


ML 


similarity avec une mdtallo 
peptidase a zinc 


SEQ ID N°31 


non pr6ditc 




pas do pr6diction 



SEQ ID N 32 


Rv 0822c 


ML 


Existence d'une region 
consensus avec la famille 
drac 


SEQ ID N°33 


Rv 1044 




pas de prediction 


SEQ ID N°34 


non predite 




pas de prediction 


SEQ ID N°35 


Rv 2169c 




pas de prediction 


SEQ ID N°36 


Rv 3909 


ML 


pas de prediction 


CPA t r\ M°OT 


KV z /OJC 




similarity avec des 
d ihydropr l co linate 
synthases 


SEQ ID N°38 


Rv 0175 




pas de prediction 




KV jUUd 


* 

ML 


prediction de sequence 
signal de lipoproteine 


CPA TH K1° /in 


KV UDiyc 




pas de prediction 


SEQ ID N°41 


Rv 2975c pouvant etre 
en phase avec Rv 2 97 4c 




similarite avec proteine de 
substilis 


SEQ ID N 42 


Rv 2622 




similarity avec une methyl 
transferase 


SEQ ID N 4J 


RV /oC 


ML 


pas de prediction 


SEQ ID N°44 


Rv 0309 


* 


pas de prediction 


SEQ ID N°45 


Rv 2169c 


ML 


pas de prediction 


SEQ ID N°46 


Rv 1411c 


* 


probable lipoproteine 
avec une sequence signal 
N-terminale 


SEQ ID N°47 


Rv 1714 




similarity avec une 
gluconate 3-dehydrogenase 


SEQ ID N°48 


Rv 0331 




similarity avec une sulfide 
dehydrogenase et une 
sulfide quinone reductase 


SEQ ID N°49 


Rv 0983 


ML 


Similarity avec une serine 
protease HtrA 
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SEQ ID N°5 








SEQ ID N°16 


Rv 3810 


ML 

A 


Prot6inc de surface 
Bcrthelct ct cil. 199'3 


SEQ ID N°22 
SEQ ID N £6 
SEQ ID N°24 


Rv 3763 


Contient un site do 
fixation de lipoproteins 
tnerobirana i re eucaryote 


SEQ ID N°50 


Rv 0125 


* 


Site actif des serines 
prot6ases 

Sequence signal N-terminale 
possible 



L£gende du tableau 3 : 

Correspondance des sequences selon 1' invention avec les 
sequences predites par Cole et al. 1998, Nature, 393, 537- 
5 544 . 

* : Prediction que la prot6ine codee par la sequence 

soit exportee 
ML : Prediction de similarite avec M. leprae. 



10 Exemple 6 : 

Caract6ristiques et obtention de la proteine M1C25 

L'extrSmit^ N terminale de la proteine M1C25 a et€ 
d^tectee par le systeme PhoA comme permettant 1 ' exportation 

15 de la proteine de fusion, necessaire & I 1 obtention de son 
activity phosphatase. 

La sequence d'ADN codant pour l'extremite N terminale de 
la proteine M1C25 est contenue dans la sequence SEQ ID N° 
20 de la presente demande de brevet. 
20 A partir de cette sequence amorce, le gene complet 

codant pour la proteine M1C25 a ete recherche dans le 
genome de M. tuberculosis (Fondation Welcome Trust, site 

Sanger) . 

Le centre Sanger a attribue 3 M1C25 les noms: 
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Rv3 576, 

MTCY06G11.23, 

pknM 

Sequence SEP ID N° 29 du g§ne complet M1C25 (714 bases) : 
cf. Figure 29 

Ce gene code pour une protSine de 237 AA, de 25 kDa de 
masse molaire. Cette protfiine est r6f£renc£e dans les 
banques sous les appellations: 
910:6306716, 
SPTREMBL:P96858 

Sequence SEP ID N° 30 de la prot6ine M1C25 (237 acides 
amines) : cf. Figure 30 

M1C25 contient un site de fixation S la partie 
lipidique des lipoprotSines de membrane des procaryotes 
(PS00013 Prokaryotic membrane lipoprotein lipid attachment 
site : 

CTGGTCGGTG CGTGCATGCT CGCAGCCGGA TGC) . 

La fonction de M1C25 n'est pas certaine mais elle 
possede tres probablement une activity n s6rine/thr6onine- 
prot^ine kinase" . Des ressemblances sont a noter avec la 
moitie C terminale de K08G_MYCTU Q11053 Rvl266c 
(MTCY50.16). Des similarity sont aussi retrouvSes avec 
KY28_MYCTU. 

En 5* du gene codant pour M1C25 se trouve un gene 
codant potentiellement pour une protSine regulatrice 
(PID:e306715 r SPTREMBL: P96857 , Rv3575c, (MTCY06G11 . 22c) ) 

Le profil d'hydrophobicit€ (Kyte et Doolitle) de M1C25 
est represents £l la figure 56. 

Un site de clivage de la sequence signal est predit 
(SignalP VI. 1; World Wide Web Prediction Server, Center for 
Biological Sequence Analysis) entre les acides amines 31 et 
32: AVA-AD. Ce site de coupure est derri^re un motif "AXA" 
classique. Cette prediction est compatible avec le profil 
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d' hydrophobic it£ . Dans cette sequence signal potent ielle il 
est a remarqu£ la r6p6tition trois fois de la sequence des 
trois acides amines LAA. 

Clonage du g£ne M1C25 en vue de la production de la 
prot6ine qu'il code: 

Un couple d' amorces a 6t6 synth6tis6 afin d* amplifier, 
3 partir de l'ADN gSnomique de M. tuberculosis, souche 
H37Rv, la totality de la sequence codant pour le 
polypeptide M1C25. L'amplicon obtenu a St6 clone dans un 
vecteur d 1 expression . 

Des couples d* amorces appropri^s pour 1 1 amplification 
et le clonage de la sequence codant pour M1C25 ont &te 
synth£tis6s : 
-amorce aller : 

5' - ATAATACCA TGGGCAAGCAGCTAGCCGCGC - 3' 
-amorce re tour : 

5 ' - ATTTATAGATCT CTGCTTAGCAACCTTGGCCGCG - 3 1 

La partie soulignee repr6sente les sequences hybridant 
specif iquement avec la sequence M1C25 et les extr§mites 5' 
correspondent a des sites de restriction en vue du clonage 
de l'amplicon resultant dans un vecteur de clonage et/ou 
d' expression. 

Un vecteur particulier utilise pour l 1 expression du 
polypeptide M1C25 est le vecteur pQE60 commercialism par la 
sociSte Qiagen, en suivant le protocole et les 
recommandations proposes par cette marque, 

Les cellules utilisSes pour le clonage sont des 
bact£ries : E. coli XLl-Blue (r£sistante & la 

tetracycline) . 

Les cellules utilisees pour l 1 expression sont des 
bacteries : E. coli M15 (resistante a la kanamycine) 
contenant le plasmide pRep4 (M15 pRep4) . 
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La production de la proteine MC25 est illustree par les 
figures 57 A et B. ( Extraits bacteriens de la souche E. 
coli M15 contenant le plasmide pMlC25. Les cultures 
bactSriennes et les extraits sont prepares selon Sambrook 
5 et al . (1989). L' analyse des extraits bacr6riens est 
effectu£e selon les instructions de Quiagen (1997) . 
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RE VEND I CAT I QNS 

1. Vecteur recombinant de criblage, de clonage et/ou 
d 1 expression, caract6ris6 en ce qu'ii se r£plique chez des 
mycobact^ries et en ce qu'il contient : 

1) un r^plicon fonctionnel chez les mycobactSries ; 

2) un marqueur de selection ; 

3) une cassette rapporteur comprenant : 

a) un site de clonage multiple (polylinker) 

b) eventuellement un terminateur de transcription actif 
chez les mycobactiries , en amont du polylinker, 

c) une sequence nucleotidique codante issue d'un gene 
codant pour un marqueur d ' expression, d 1 exportation et/ou 
de secretion de proteine, ladite sequence nucleotidique 
etant depourvue de son codon d' initiation et de ses 
sequences de regulation, et 

d) une sequence nucleotidique codante issue d'un gene 
codant pour un marqueur d'activite de promoteurs contenus 
dans le meme fragment, ladite sequence nucleotidique etant 
pourvue de son codon d • initiation . 

2. Vecteur recombinant selon la revendicat ion 1, 
caract€ris£ en ce que la sequence nucleotidique codante 
issue d'un g£ne codant pour un marqueur d' expression, 
d' exportation et/ou de secretion de proteine est une 
sequence codante issue du gene phoA de la phosphatase 
alcaline . 

3, Vecteur recombinant selon l'une des revendications 1 et 
2, caracterisg en ce que la sequence nucleotidique codante 
issue d'un gene codant pour un marqueur d' expression, 
d' exportation et/ou de secretion de proteine est une 
sequence codante du gene de la p-agarase, de la nuclease 
d'un staphylocoque ou de la (}- lactamase d'une mycobacterie . 
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4. Vecteur recombinant selon l'une des revendications 1 a 

3, caract6ris£ en ce que la sequence nucleotidique codante 
issue d'un gdne codant pour un marqueur d'activite de 
promoteurs contenus dans le meme fragment est une sequence 

5 codante issue du g£ne luc de la lucif6rase de luciole. 

5. Vecteur recombinant selon l'une des revendications 1 a 

4, caract6ris6 en ce que la sequence nucleotidique codante 
issue d'un gene codant pour un marqueur d'activite de 

10 promoteurs contenus dans le meme fragment est une sequence 
codante issue du gene GFP de la Green Fluorescent Protein. 

6. Vecteur recombinant selon l'une des revendications 1 a 

5, caract§rise en ce que le terminateur de transcription 
15 actif chez les mycobactSries est le terminateur du 

coliphage T4 (tT4) . 

7. Vecteur recombinant selon l'une des revendications 1 a 

6, caract6ris6 en ce qu'il est un plasmide choisi parmi les 
20 plasmides suivants deposes a la CNCM (Collection Nationale 

de Cultures de Microorganismes, Paris, France) : 

a) pJVEDa depose a la CNCM sous le N° 1-1797, 
le 12/12/1996, 

b) pJVEDb dSposS a la CNCM sous le N° 1-1906, le 25 juillet 
25 1997, 

c) pJVEDc deposS i la CNCM sous le N° 1-1799, le 
12/12/1996, 

8, Vecteur recombinant selon l'une des revendications 1 a 
30 7, caracteris6 en ce qu'il comprend en I'un des sites de 
clonage du polylinker une sequence d'acide nuclSique de 
mycobacterie chez laquelle on detecte un polypeptide 
susceptible d'etre exporte et/ou secr&te, et/ou d'etre 
induit ou reprim£ lors de 1' infection par ladite 
35 mycobacterie ou encore exprime ou produit de fagon 
constitutive, ainsi que les sequences promotrices et/ou 
rSgulatrices associSes susceptibles de permettre ou de 



WO 99/09186 



PCT/FR98/01813 



107 

favoriser 1 1 exportation et/ou la secretion dudit 
polypeptide, ou tout ou partie de gene codant pour ledit 
polypeptide . 

5 9. Vecteur recombinant selon l'une des revendications 1 5 

8, caract6ris6 en ce que la sequence d'acide nucieique de 
mycobacterie qu'il contient est obtenue par fragmentation 
physique ou par digestion enzymatique de l'ADN gSnomique ou 
de 1 1 ADN complement aire d'un ARN d'une mycobacterie . 

10 

10. Vecteur recombinant selon l'une des revendications 1 a 

9, caract6ris£ en ce que ladite mycobacterie est M. 
tuberculosis . 

15 11. Vecteur recombinant selon l'une des revendications 1 a 
9, caracterise en ce que ladite mycobacterie est choisie 
parmi M. africanum, M. bovis, M. avium ou M. 2eprae. 

12, Vecteur recombinant selon la revendication 10, 
20 caractSrisS en ce qu'il est un plasmide choisi parmi les 
plasmides suivants deposes a la CNCM : 

a) p6D7 depose le 28 janvier 1997 a la CNCM sous le N°I- 
1814, 

b) p5A3 depos^ le 28 janvier 1997 a la CNCM sous le N°I- 
25 1815, 

c) p5F6 depose le 28 janvier 1997 a la CNCM sous le N°I- 
1816, 

d) p2A29 depose le 28 janvier 1997 a la CNCM sous le N°I- 
1817, 

30 e) pDP428 deposg le 28 janvier 1997 a la CNCM sous le N°I- 
1818, 

f) p5B5 depose le 28 janvier 1997 a la CNCM sous le N°I- 
1819, 

g) plC7 depose le 28 janvier 1997 k la CNCM sous le N°I- 
35 1820, 

h) p2D7 depose le 28 janvier 1997 a la CNCM sous le N°I- 
1821, 
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i) plB7 depose le 31 janvier 1997 & la CNCM sous le N°I- 
1843, 

j) pJVED/W. tuberculosis depose le 25 juillet 1997 a la 

CNCM SOUS le N° 1-1907, 
5 k) pMlC25 depose le 4 aoQt 1998 a la CNCM sous le n°I-2062. 

13. Vecteur recombinant selon la revendication 12, 
caract6ris6 en ce qu'il s'agit du plasmide pDP428 depose le 
28 janvier 1997 a la CNCM sous le N°I-1818. 

10 

14. ProcedS de criblage de sequences de nucleotides issues 
de mycobacteries pour determiner la presence de sequences 
correspondant a des polypeptides exportes et/ou s6cr£tes 
pouvant £tre induits ou r6prim6s lors de 1' infection, leurs 

15 sequences promotrices et/ou regulatrices associees 
susceptibles notamment de permettre ou de favoriser 
1 'exportation et/ou la secretion desdits polypeptides 
d'interet, ou tout ou partie de genes d'interet codant pour 
lesdits polypeptides, caract6ris6 en ce qu'il met en oeuvre 

20 un vecteur selon 1 1 une des revendications 1 a 13. 

15. Procede de criblage selon la revendication 14, 
caract§rise en ce qu'il comprend les etapes suivantes : 

a) la fragmentation physique des sequences d'ADN de 
25 mycobacteries ou leur digestion par au moins une enzyme 

determine et la recuperation des fragments obtenus ; 

b) 1* insertion des fragments obtenus a I'etape a) dans un 
site de clonage, compatible le cas echeant avec l'enzyme de 
I'etape a), du polylinker d'un vecteur selon I'une des 

30 revendications 1 a 13 ; 

c) si besoin, 1 ' amplification desdits fragments contenus 
dans le vecteur, par exemple par replication de ce dernier 
apres insertion du vecteur ainsi modifie dans une cellule 
determinee, de preference E coli ; 

35 d) la transformation de cellules hotes par le vecteur 
amplifie & l*etape c) , ou en l'absence d 1 amplification, par 
le vecteur de l*etape b) ; 
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e) la culture die cellules hotes transf ormees dans un milieu 
permettant la mise en evidence du marqueur d ' exportation 
et/ou de s£cr6tion, et /ou du marqueur d* activity de 
promoteurs contenu dans le vecteur ; 

f) la detection des cellules hotes positives (colonies 
positives) pour 1' expression du marqueur d 1 exportation 
et/ou de s6cr6tion, et /ou du marqueur d' activity de 
promoteurs ; 

g) 1 ' isolement de l'ADN des colonies positives et 
l 1 insertion de cet ADN dans une cellule identique a celle 
de 1' 6 tape c) ; 

h) la selection des insertions contenues dans le vecteur, 
permettant l'obtention de clones positifs pour le marqueur 
d ' exportation et/ou de secretion, et /ou pour le marqueur 
d' activity de promoteurs ; 

i) l 1 isolement et la caracterisation des fragments d'ADN de 
mycobact£ries contenues dans ces inserats, et l'6tape i) du 
proc£de pouvant comporter en outre une etape de sSquengage 
des insertions s61ectionn£es . 

16. Banque d'ADN g£nomique ou d'ADNc complementaire d'ARNm 
de mycobacterie, caracteris^e en ce qu'elle est obtenue par 
un procede selon la revendicat ion 14 et/ou un procede 
comprenant les etapes a) et b) , ou a) , b) et c) du procede 
selon la revendication 15. 

17. Banque d'ADN g6nomique ou d'ADNc complementaire d'ARNm 
de mycobacterie selon la revendication 16 , caract6ris£e en 
ce que ladite mycobacterie est une mycobacterie pathogene. 

18. Banque d 1 ADN genomique ou d 1 ADNc complementaire d'ARNm 
de mycobacterie selon la revendication 17, caract6ris6e en 
ce que ladite mycobacterie est une mycobacterie appartenant 
au groupe du complexe Mycobacterium tuberculosis . 
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19. Banque d'ADN genomique ou d'ADNc compiementaire d'ARNm 
de mycobacterie selon la revendication 18, caracterisee en 
ce que ladite mycobacterie est Mycobacterium tuberculosis . 

5 20. Sequence nucieotidique de mycobacterie ou comprenant 
une sequence nucieotidique de mycobacterie susceptible 
d'etre s61ectionn6e par un precede selon 1 ' une des 
revendications 14 et 15. 

10 21. Sequence nucieotidique de mycobacterie ou comprenant 
une sequence nucieotidique de mycobacterie selon la 
revendication 20, caracterisee en ce que ladite 
mycobacterie est choisie parmi M. tuberculosis, M. bovis, 
M. africanum, M. avium, M. leprae, M. paratuberculosis, M. 

15 kansassi ou M. x6nopi . 

22. sequence nucieotidique selon l'une des revendications 
20-21 caracterisee en ce qu'elle est choisie parmi les 
sequences de fragments d'ADN de mycobacterie de sequence 

20 nucleique SEQ ID N°l a SEQ ID N° 24C, SEQ ID N°27A a SEQ ID 
N°27C, SEQ ID N°29 et SEQ ID N° 31A a SEQ ID N°50F. 

23. Sequence nucieotidique de mycobacterie l'une des 
revendications 20-21 caracterisee en ce qu'elle est choisie 

25 parmi les sequences de fragments d'ADN de mycobacterie de 
sequence SEQ ID N°l, SEQ ID N°3A, SEQ ID N°5A, SEQ ID N°6A, 
SEQ ID N°7A, SEQ ID N°8A, SEQ ID N°9A, SEQ ID N°10A, SEQ ID 
N°27A ou SEQ ID N°29 contenus respectivement dans les 
vecteurs pDP428 (CNCM, N°I-1818) , p6D7 (CNCM, N°I-1814), 

30 p5F6 (CNCM, N°I-1816), p2A29 (CNCM, N°I-1817) , p5B5 (CNCM, 
N°I-1819) ,plC7 (CNCM, N°I-1820) , p2D7 (CNCM,N°I-1821) , 
plB7(CNCM, N°I-1843), p5A3 (CNCM, N°I-1815) et pMlC25 
(CNCM, N°I-2062) . 

35 24. Sequence nucieotidique comprenant la totalite du cadre 
ouvert de lecture d'une sequence selon l'une quelconque des 
revendications 20 a 23. 
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25. Polynucleotide caracterise en ce qu'il comprend un 
polynucleotide choisi parmi : 

a) un polynucleotide dont la sequence est compiementaire de 
5 la sequence d'un polynucleotide selon l'une des 

revendications 20 k 24, 

b) un polynucleotide dont la sequence comporte au moins 50% 
d'identite avec un polynucleotide selon l'une des 
revendications 20 a 24, 

10 c) un polynucleotide hybridant dans des conditions de forte 
stringence avec une sequence de polynucleotide selon l'une 
des revendications 20 a 24, 

d) un fragment d ! au moins 8 nucleotides consecutifs d'un 
polynucleotide defini selon l'une des revendications 20 a 
15 24 ou defini en a) . 

26. Polypeptide, leurs fragments ou fragments 
biologiquement act if s ou leurs polypeptides homologues, 
susceptible d'etre code par une sequence nucleotidique de 

20 mycobacterie selon l'une des revendications 20 a 25, et 
susceptible d'etre exporte et/ou secrete, et/ou induit ou 
reprime, ou exprime de fa?on constitutive lors de 
1 ' infection . 

25 27. Mycobacterie recombinante caracterisee en ce qu'elle 
est transformee par un vecteur recombinant selon l'une des 
revendications 1 oi 13, 

28. Polynucleotide dont la sequence est choisie parmi les 
30 sequences nucleotidiques de sequence SEQ ID N°l a SEQ ID 

N°2. 

29, Polynucleotide caracterise en ce qu'il comprend un 
polynucleotide choisi parmi : 

35 a) un polynucleotide dont la sequence est choisie parmi les 
sequences nucleotidiques SEQ ID N°l a SEQ ID N°2, 
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b) un polynucleotide dont la sequence nucleique est la 
sequence comprise entre le nucleotide en position nt 964 et 
le nucleotide en position nt 1234, extr^mit^s indues, de 
la sequence SEQ ID N°l, 

c) un polynucleotide dont la sequence est compiementaire de 
la sequence d'un polynucleotide defini en a) ou b) , 

d) un polynucleotide dont la sequence comporte au moins 50% 
d'identite avec un polynucleotide defini en a), b) ou c) , 

e) un polynucleotide hybridant dans des conditions de forte 
stringence avec une sequence de polynucleotide defini en 
a) , b) , c) ou d) , 

f) un fragment d'au moins 8 nucleotides consecutifs d'un 
polynucleotide defini en a), b) , c) , d)ou e) . 

30. Polynucleotide selon l'une des revendications 20 a 25, 
28 et 29, caracterise en ce que sa sequence nucleique 
hybride avec l'ADN de sequence de mycobacteries et 
preferentiellement avec de l'ADN de sequences de 
mycobacteries appartenant au complexe de Mycobacterium 

tuberculosis . 

31. Polypeptide caracterise en ce qu'il est code par une 
sequence polynucieotidique selon l'une des revendications 
20 a 25. 

32. Polypeptide caracterise en ce qu'il comprend un 
polypeptide choisi parmi : 

a) un polypeptide dont la sequence d'acides amines est 
comprise dans une sequence d'acides amines choisie parmi 
les sequences d'acides amines SEQ ID N° 1 a SEQ ID N° 24C, 
SEQ ID N° 27A a SEQ ID N° 28 et SEQ ID N° 30 a SEQ ID N° 
50F, 

b) un polypeptide homologue au polypeptide defini en a) , 

c) un fragment d'au moins 5 acides amines d'un polypeptide 
defini en a) ou b) , 

d) un fragment biologiquement actif d'un polypeptide defini 
en a) , b) , ou c) . 



WO 99/09186 PCT/FR98/01813 



113 



33. Polypeptide dont la sequence d'acides amines est 
comprise dans la sequence d'acides amines SEQ ID N°l ou SEQ 
ID N°2, ou polypeptide de sequence d'acides amines SEQ ID 

5 N°28. 

34. Polynucleotide caracterise en ce qu'il code pour un 
polypeptide selon l'un des revendications 32 et 33. 

10 35. Sequence d'acide nucleique utilisable comme amorce, 
caracterisee en ce que ladite sequence est choisie parmi 
les sequences d'acide nucleique de polynucleotide selon 
1 1 une des revendications 20 a 25, 28 a 30, et 34. 

15 36. Sequence d'acide nucleique selon la revendicat ion 35, 
caracterisee en ce que ladite sequence est choisie parmi 
les sequences SEQ ID N°25 et SEQ ID N°26. 

37. Sequence d'acide nucleique selon 1 ' une des 
20 revendications 35 et 36 pour la detection et/ou 

1 1 amplification de sequences nucieiques. 

38. Sequence d'acide nucleique utilisable comme sonde, 
caracterisee en ce que ladite sequence est choisie parmi 

25 les sequences d'acide nucleique selon l'une des 
revendications 20 S 25, 28 k 30, et 34. 

39. sequence d'acide nucleique selon la revendication 38, 
caracterisee en ce qu'elle est marquee par un compose 

30 radioactif ou par un compose non radioactif . 

40. sequence d'acide nucleique selon l'une des 
revendications 38 et 39, caracterisee en ce que celle-ci 
est immobilisee sur un support, de. maniSre covalente ou 

35 non- covalente. 
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41. Sequence d'acide nucieique selon l'une des 
revendications 38 a 40 pour la detection et/ou 
1 ' amplification de sequences nucleiques. 

42. Sequence d'acide nucieique selon l'une des 
revendications 3 8 & 41, caract§ris6e en ce que ladite 
sequence est une sequence comprise entre le nucleotide en 
position nt 964 et le nucleotide en position nt 1234, 
extremites indues, de la sequence SEQ ID N°l. 

43. Vecteur recombinant de clonage, d 1 expression et/ou 
d' insertion , caracterise en ce qu'il contient une sequence 
d'acide nucieique de polynucleotide selon l'une des 
revendications 20 a 25, 28 a 30, et 34. 

44. Cellule hote, caracterisee en ce qu'elle est 
transf orm€e par un vecteur recombinant selon la 
revendication 43. 

45. Cellule hote selon la revendication 44, caracterisee en 
ce qu'il s'agit de la souche de £. coli transform£e par le 

plasmide pDP428 depose le 28 janvier 1997 a la CNCM sous le 
N°I-1818 ou transformee par le plasmide pM!C25 depose le 
4 aoOt 1998 a la CNCM sous le n°I-206 2, ou d'une souche de 
M. tuberculosis, M. bovis ou M. africanum possedant 
potent iellement tous les systSmes de regulation appropri^s. 

46. Precede de preparation d'un polypeptide, caracterise en 
ce qu'il met en oeuvre un vecteur selon la revendication 
43. 

47. Polypeptide recombinant susceptible d'etre obtenu par 
un procedS selon la revendication 46. 

48. Polypeptide hybride, caracterise en ce qu'il comporte 
au moins la sequence d'un polypeptide selon l'une des 
revendications 26, 32, 33 et 47 et une sequence d'un 
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polypeptide susceptible d'induire une reponse immunitaire 
chez 1 1 homme ou 1 ' animal . 

49. Polypeptide hybride selon la revendication 48, 
5 caract€ris£ en ce que le polypeptide susceptible d'induire 
une rSponse immunitaire contient au moins un determinant 
antig£nique capable d'induire une reponse humorale et/ou 
cellulaire . 

10 50. Polynucleotide codant pour un polypeptide hybride selon 
l'une des revendications 4 8 et 49. 

51. Polypeptide hybride selon l'une des revendications 48 
et 49, caracterisSe en ce qu'il s'agit d f une proteine 

15 recombinante obtenue par 1' expression d'un polynucleotide 
selon la revendication 50. 

52. Proc6de pour la detection in vitro d'anticorps dirig^s 

contre une mycobacterie et prSferentiellement une bacterie 
20 du complexe Mycobacterium tuberculosis dans un echantillon 

biologique, caract£rise en ce qu'il comprend les Stapes 
suivantes : 

a) mise en contact de 1 ' echantillon biologique avec un 
polypeptide selon l'une des revendications 26, 32, 33 et 

25 47 ; 

b) mise en Evidence du complexe antigene-anticorps forme. 

53. Precede pour la detection d'une infection par une 
mycobacterie et pref erentiellement une bacterie du complexe 

30 Mycobacterium tuberculosis dans un mammifSre, caracterise 
en ce qu'il comprend les etapes suivantes : 
a) preparation d'un echantillon biologique contenant des 
cellules dudit mammifere plus particulierement des cellules 
du systSme immunitaire dudit mammifere et plus 

35 particulidrement encore des cellules T ; 
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b) incubation de 1 ' 6chantillon biologique de l'etape a) avec 
un polypeptide selon l'une quelconque des revendications 
26, 32, 33 et 47 ; 

c) detection d'une reaction cellulaire indiquant une 
5 sensibilisation pr£alable du mammifere audit polypeptide 

notamment la proliferation cellulaire et/ou la synthase de 
prolines telles que l 1 interferon gamma; 

d) detection d'une reaction d 1 hypersensibilitS retard^e ou 
de sensibilisation du mammifere audit polypeptide. 

10 

54. Kit pour le diagnostic in vitro d ! une infection par une 
mycobacterie appartenant au complexe Mycobacterium 
tuberculosis , comprenant : 

a) un polypeptide selon l'une des revendications 26, 32, 33 
15 et 47 ; 

b) le cas 6cheant, les reactifs pour la constitution du 
milieu propice & la reaction immunologique ; 

c) les reactifs permettant la detection des complexes 
antigene-anticorps produits par la reaction immunologique ; 

20 d) le cas echeant, un 6chantillon biologique de reference 
(temoin negatif) depourvu d'anticorps reconnus par ledit 
polypeptide ; 

e) le cas echeant, un Schantillon biologique de reference 
(temoin positif) contenant une quantity pr§d£terminee 

25 d'anticorps reconnus par ledit polypeptide. 

55. Anticorps mono- ou polyclonaux, leurs fragments, ou 
anticorps chim6riques, caracterises en ce qu'ils sont 
capables de reconnaltre specif iquement un polypeptide selon 

30 l'une des revendications 26, 32, 33 et 47 . 

56. Anticorps selon la revendication 55, caracterisS en ce 
qu'il s'agit d'un anticorps marque. 

35 57 . ProcSde pour la detection specif ique de la presence 
d'un antig&ne d'une bacterie du complexe Mycobacterium 
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tuberculosis dans un Echantillon biologique, caractErise en 
ce qu'il comprend les Stapes suivantes : 

a) mise en contact de 1 ' Echantillon biologique avec un 
anticorps selon l ! une des revendicat ions 55 et 56 ; 

b) mise en Evidence du complexe ant igEne-ant icorps formE. 

58. Kit pour la detection spEcifique de la presence d'un 
antigene d'une bactErie du complexe Mycobacterium 
tuberculosis dans un Echantillon biologique, caractErise en 
ce qu'il comprend les ElEments suivants : 

a) un anticorps polyclonal ou monoclonal selon l'une des 
revendications 55 et 56 ; 

b) les reactifs pour la constitution du milieu propice a la 
reaction immunologique ; 

c) les reactifs permettant la detection des complexes 
antigene-anticorps produits par la reaction immunologique. 

59. ProcEdE de detection et d ' identification rapide d'une 
mycobacterie et prEf Erentiellement de M. tuberculosis dans 
un echantillon biologique, caracterise en ce qu'il 
comporte les etapes suivantes : 

a) isolement de 1 1 ADN a partir de 1 1 echantillon biologique 
a analyser, ou obtention d'un ADNc a partir de 1 1 ARN de 
1 ' Echantillon biologique ; 

b) amplification spEcifique de 1 ' ADN des mycobactEries 
appartenant au complexe Mycobacterium tuberculosis a 
I'aide d' amorces selon l'une des revendications 3 5 a 37 ; 

c) analyse des produits d' amplification. 

60. ProcEdE pour la detection de bacteries appartenant au 
complexe Mycobacterium tuberculosis dans un Echantillon 

biologique, caracterise en ce qu'il comprend les Etapes 
suivantes : 

a) mise en contact d'une sonde oligonucleotidique selon 
l'une des revendications 3 8 a 42 avec un echantillon 
biologique, 1 'ADN contenu dans 1 ' Echantillon biologique 
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ayant , le cas echeant, prealablement ete rendu accessible a 
1 • hybridation, dans des conditions permettant 1 1 hybridation 
de la sonde a l'ADN d'une bacterie du complexe 
Mycobacterium tuberculosis ; 

b) detection de 1 ' hybride forme entre la sonde 
oligonucieotidique et l'ADN de 1 ' echantillon biologique. 

61. Proc£de pour la detection de bacteries appartenant au 
complexe Mycobacterium tuberculosis dans un echantillon 

biologique, caracterisS en ce qu'il comprend les e tapes 
suivantes : 

a) mise en contact d'une sonde oligonucieotidique 
immobilisee sur un support selon la revendication 40 avec 
un echantillon biologique, l'ADN de 1 ' echantillon, ayant, 
le cas echeant, 6te prealablement rendu accessible a 
1 1 hybridation, dans des conditions permettant 
1 'hybridation de la sonde a l'ADN d'une bacterie du 
complexe Mycobacterium tuberculosis ; 

b) mise en contact de 1' hybride forme entre la sonde 
oligonucieotidique immobilisee sur un support et l'ADN 
contenu dans 1 " echantillon biologique, le cas echeant 
apres elimination de l'ADN de 1 * echantillon biologique 
n' ayant pas hybride avec la sonde, avec une sonde 
oligonucieotidique marquee selon la revendication 39. 

62. Procede de detection selon la revendication 61, 
caract6ris§ en ce que, prealablement a l'etape a), l'ADN de 
1' echantillon biologique, ou l'ADNc obtenu par 
transcription inverse de l'ARN de 1 1 echantillon, est 
amplifie a l'aide d'un couple d 1 amorces selon l'une des 
revendications 35 a 37. 

63. Procede pour la detection de la presence d'une bacterie 
appartenant au complexe de Mycobacterium tuberculosis dans 

un echantillon biologique, caracterise en ce qu'il comprend 
les etapes suivantes : 
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a) mise en contact de 1 ' Echantillon biologique avec un 
couple d'amorces selon l'une des revendications 35 a 37, 
l'ADN contenu dans 1 1 Echantillon ayant EtE, le cas EchEant, 
prEalablement rendu accessible a 1 ' hybridation, dans des 
conditions permettant une hybridation des amorces a l'ADN 
d'une bactErie du complexe Mycobacterium tuberculosis ; 

b) amplification de l'ADN de la bactErie du complexe 
Mycobacterium tuberculosis ; 

c) mise en Evidence de 1 • amplification de fragments d'ADN 
correspondant au fragment encadrE par les amorces, par 
exemple par Electrophorese sur gel ou au moyen d'une sonde 
oligonuclEotidique marquee selon la revendicat ion 39. 

64. ProcedE pour la detection de la presence d'une bactErie 
appartenant au complexe de Mycobacterium tuberculosis dans 

un echantillon biologique, caracterise en ce qu'il comprend 
les etapes suivantes : 

a) mise en contact de 1 1 Echantillon biologique avec deux 
couples d'amorces selon l'une des revendications 35 a 37, 
l'ADN contenu dans 1 ' echantillon ayant Ete, le cas 
EchEant, prEalablement rendu accessible a 1 1 hybridation, 
dans des conditions permettant une hybridation des amorces 
a l'ADN d'une bactErie du complexe Mycobacterium 
tuberculosis ; 

b) amplification de l'ADN de la bactErie du complexe 
Mycobacterium tuberculosis ; 

c) mise en Evidence de 1 ' amplification de fragments d'ADN 
correspondant au fragment encadrE par lesdites amorces, par 
exemple par Electrophordse sur gel ou au moyen d'une sonde 
oligonuclEotidique marquEe selon la revendication 39. 

65. Kit pour la dEtection de la prEsence d'une bactErie du 
complexe Mycobacterium tuberculosis dans un Echantillon 

biologique, caractErisE en ce qu'il comprend les ElEments 
suivants : 
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a) une sonde oligonucl§otidique selon l'une des 
revendications 38 a 42 ; 

b) les rSactifs n£cessaires a la mise en oeuvre d'une 
reaction d ' hybridation ; 

5 c) le cas £ch6ant, un couple d' amorces selon l'une des 

♦ 

revendications 35 & 37 ainsi que les r^actifs nScessaires 
a une reaction d* amplification de l'ADN (ADN gSnomique, 
plasmidique ou ADNc) d'une bactSrie du complexe 
Mycobacteri um tuberculosis . 

10 

66. Kit ou necessaire pour la detection de la presence 
d'une bact6rie du complexe Mycobacterium tuberculosis dans 

un echantillon biologique, caracterise en ce qu'il comprend 
les elements suivants : 
15 a) une sonde oligonucleotidique , dite sonde de capture, 
selon la revendication 40 ; 

b) une sonde oligonucleotidique, dite sonde de r£v61ation, 
selon l'une des revendications 38 a 42 ; 

c) le cas echeant, un couple d' amorces selon l'une des 
20 revendications 35 a 37 ainsi que les reactifs ndcessaires 

a une reaction d ' amplification de l'ADN d'une bact£rie du 
complexe Mycobacterium tuberculosis , 

67. Kit pour 1 ' amplification de l'ADN d'une bactfirie du 
25 complexe Mycobacterium tuberculosis present dans un 

Echantillon biologique, caract£ris£ en ce qu'il comprend 
les Elements suivants : 

a) un couple d' amorces selon l'une des revendications 35 a 
37 ; 

30 b) les rSactifs necessaires pour effectuer une reaction 
d' amplification d' ADN ; 

c) eventuellement un composant permettant de verifier la 
sequence du fragment amplifie, plus particulierement une 
sonde oligonucleotidique selon l'une des revendications 38 
35 a 42. 
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68. Composition immunogene caracteris§e en ce qu'elle 
comprend un ou plusieurs polypeptides selon l'une des 
revendications 26, 32, 33 et 4 7 et/ou un ou plusieurs 
polypeptides hybrides selon l'une des revendications 48, 4 9 

5 et 51. 

69. Vaccin caract6ris6 en ce qu ! il contient un ou plusieurs 
polypeptides selon l'une des revendications 26, 32, 33 et 
47 et/ou un ou plusieurs polypeptides hybrides selon l'une 

10 des revendications 48, 49 et 51, en association avec un 
vehicule pharmaceutiquement compatible et, le cas echeant 
un ou plusieurs adjuvants de l'immunite appropri^s. 

70. Vaccin destin£ a 1 1 immunisation a l'encontre d'une 
15 infection bact§rienne ou virale, telle que la tuberculose 

ou 1' hepatite, comprenant un vecteur selon la revendication 
43 ou un polynucleotide selon la revendication 50, en 
association avec un vehicule pharmaceutiquement acceptable. 

20 71. Vaccin caractSrise en ce qu'il contient une ou 
plusieurs sequences nucleotidiques selon l'une des 
revendications 20 S 24 et/ou un ou plusieurs 
polynucleotides selon la revendication 25 en association 
avec un vehicule pharmaceutiquement compatible et, le cas 

25 echeant, un ou plusieurs adjuvants de l'immunite 
appropriSs . 

72. M£thode de criblage de molecules capables d'inhiber 
la croissance de mycobacteries ou le maintien de 
30 mycobacteries dans un hote, caracteris^e en ce que lesdites 
molecules bloquent la synthese ou la fonction des 
polypeptides codes par une sequence nuclgotidique selon 
l'une quelconque des revendications 20 & 24 ou par un 
polynucleotide selon la revendication 25. 

35 
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73. M6thode de criblage selon la revendication 72, 
caract§ris6e en ce que les molecules sont des anti- 
messagers ou induisent la synthese d • anti -messagers . 

5 74. Molecules capables d'inhiber la croissance de 

mycobact^ries ou le maintien de mycobactSries dans un hote, 
caract£ris6es en ce que lesdites molecules sont 
synth6tis6es d'aprds la structure des polypeptides cod6s 
par une sequence nuclSotidique selon 1 ' une quelconque des 

It) revendications 20 a 24 ou par un polynucleotide selon 
la revendication 25. 



20 
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1 GGATC CC AGGGAACGTGACC ATG GTC GTA GGG ATG ACT TGA CAGTTTCAACGGGGTGCGACCACCGTTGCGC 72 
X MVVGMT* 7 

73 TCAGAAGGC ATACGTTGGTGGAACAC GTC GGAAAGCTGGGAGGTGAATC TG ATG GCT GGC GAC CAA GAG CTG 144 

7 
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CCG 
P 


GTC 
V 


CGG 
R 


385 
88 


TTG 
L 


CGG 
R 


GGG 
G 


CCG 
P 


TTG 
L 


GGT 
G 


GGG 
G 


GTT 
V 


GGG 
G 


TGC 
C 


CTC 
L 


CGT 
R 


CAC 
H 


CCC 
P 


AGG 
R 


CAG 
Q 


TTC 

F 


GCT 
A 


GGC 
G 


TAT 
Y 



47 



67 



87 



107 



445 TTG TCG CAG TAG C GC GACGGCAT TGTC G ATG TCT TGG TAG CTAGCATCCGGTCGGGGGGCCGCTACCAGCG 515 
108 L S Q * M S W 4 

516 CCAGCGCCGGGGCTCCCCGGTCCGGGTAGTGCGCGTCGAGTTGGTCGTGGACCAGCA ATG ACT GCG ACC CGG 587 
1 M T A T R 5 



588 
6 


CGA 
R 


CTT 
L 


CGA 
R 


AAC 
N 


CGC 
R 


CAC 
H 


CGG 
R 


TTA 
L 


GAT 
D 


TCC 
S 


CCG 
P 


ACT 
T 


GCG 
A 


TCA 
S 


TCG 
S 


CCA 
P 


GGT 
G 


AAA 
K 


CCG CCG 
P P 


648 
26 


GCA 
A 


CTA 
L 


ACG 
T 


CCA 
P 


GCA 
A 


ACC 
T 


AAC 
N 


CCG 
P 


TGA 
* 


AGACCAACCAACGGCACCTGCGCAGGTTGCGGCTCAACCGCATC 


719 
1 


ATG 
M 


AAC 
N 


TGC 
C 


TGG 
W 


ATT 
I 


TCG 
S 


GAC 
D 


TCC 
S 


CCG 
P 


TAC 
Y 


TCT 
S 


CGC 
o 


GCA 
A 


GTG 
V 


CGT 
R 


GCC 
A 


CGC 
R 


GAG 
E 


CCT ACC 
P T 


779 
21 


GAA 
E 


GAT 
D 


CGC 
R 


GTG 
V 


CAT 
H 


GCG 
A 


TTC 
F 


GGC 
G 


GTG 
V 


GAC 
D 


CGC 
R 


ACA 
T 


GCA 
A 


CCT 
P 


GGA 
G 


GTT 
V 


GGC 
G 


GGC 
G 


GCC GAG 
A E 


839 
41 


GGC 
G 


CGA 
R 


GAT 
D 


GGC 
G 


AGG 
R 


ATG 
M 


ACG 
T 


GAT 
D 


CGT 
R 


CGG 
R 


GGG 
G 


CGG 
R 


GAA 
E 


CTC 
L 


CCA 
P 


GGC 
G 


CGC 
R 


CGG 
R 


ACC GTC 
T V 


899 
61 


GCA 
A 


AAC 
N 


CCG 
P 


TCG 
S 


CAA 
Q 


ACC 
T 


CGT 
R 


CGC 
R 


AAA 
K 


CCG 
P 


TAA 
+ 


GGAGTCATCC ATG AAG ACA GGC ACC GCG 
M K T G T A 


960 
7 


ACG 
T 


ACG 
T 


CGG 
R 


CGC 
R 


AGG 
R 


CTG 
L 


TTG 
L 


GCA 
A 


GTA 

V 


CTG 
L 


ATC 
I 


GCC 
A 


CTC 
L 


GCG 
A 


TTG 
L 


CCG 
P 


GGG 
G 


GCC 
A 


GCC GTT 
A V 


1020 
27 


GCG 
A 


CTG 
L 


CTG 
L 


GCC 
A 


GAA 
E 


CCA 
P 


TCA 
S 


GCG 
A 


ACC 
T 


GGC 
G 


GCG 
A 


TCG 
S 


GAC 
D 


CCG 
p 


TGC 

C 


GCG 
A 


GCC 
A 


AGC 

S 


GAA GTG 
S V 


1080 
47 


GCG 
A 


AGG 
R 


ACG 
T 


GTC 
V 


GGT 
G 


TCG 
S 


GTC 
V 


GCC 
A 


AAG 

K 


TCG 
S 


ATG 
M 


GGC 
G 


GAC 
D 


TAC 
Y 


CTG 
L 


GAT 
D 


TCA 
S 


CAC 

H 


CCA GAG 
P E 


1140 
67 


ACC 
T 


AAC 
N 


CAG 
Q 


GTG 
V 


ATG 
M 


ACC 
T 


GCG 
A 


GTC 
V 


TTG 
L 


CAG 
Q 


CAG 
Q 


CAG 
Q 


GTA 

V 


GGG 
G 


CCG 
P 


GGG 
G 


TCG 

S 


GTC 
V 


GCA TCG 
A S 


1200 
87 


CTG 
L 


AAG 
K 


GCC 
A 


CAT 
H 


TTC 

c 


GAG 
E 


GCG 
A 


AAT 
N 


CCC 

P 


AAG 
K 


GTC 
V 


GCA 

A 


TCG 

S 


GAT 

n 


CC 











25 



34 



20 



40 



60 



66 



36 



1243 
100 



SEQ ID N° 1 



FIGURE 1 

FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



2/185 



Insert du clone contenant DP428 et contenu dans seql 
1/1 31/11 

GAT CGC CTT TGA CGC CTA TTC GGT CGC GCA GCT TTT TGG CGA CGT CAC TGG TGC CCG CGT 
asp arg leu OPA arg leu phe gly arg ala ala phe trp arg arg his trp cys pro arg 
61/21 91/31 

TGC GGG CGT CCA GCC GCA GCG ACA CCA CAT ACG GCC GGT CCG GTT GCG GGG GCC GTT GGG 
cys gly arg pro ala ala ala thr pro his thr ala gly pro val ala gly ala val gly 
121/41 151/51 

TGG GGT TGG GTG CCT CCG TCA CCC CAG GCA GTT CGC TGG CTA TTT GTC GCA GTA GCG CGA 
trp gly trp val pro pro ser pro gin ala val arg trp leu phe val ala val ala arg 
181/61 211/71 

CGG CAT TGT CGA TGT CTT GGT AGC TAG CAT CCG GTC GGG GGG CCG CTA CCA GCG CCA GCG 
arg his cys arg cys leu gly ser AMB his pro val gly gly pro leu pro ala pro ala 
241/81 271/91 

CCG GGG CTC CCC GGT CCG GGT AGT GCG CGT CGA GTT GGT CGT GGA CCA GCA ATG ACT GCG 
pro gly leu pro gly pro gly ser ala arg arg val gly arg gly pro ala met thr ala 
301/101 331/111 

ACC CGG CGA CTT CGA AAC CGC CAC CGG TTA GAT TCC CCG ACT GCG TCA TCG CCA GGT AAA 
thr arg arg leu arg asn arg his arg leu asp ser pro thr ala ser ser pro gly lys 
361/121 391/131 

CCG CCG GCA CTA ACG CCA GCA ACC AAC CCG TGA AGA CCA ACC AAC GGC ACC TGC GCA GGT 
pro pro ala leu thr pro ala thr asn pro OPA arg pro thr asn gly thr cys ala gly 
421/141 451/151 

TGC GGC TCA ACC GCA TCA TGA ACT GCT GGA TTT CGG ACT CCC CGT ACT CTC GCG CAG TGC 
cys gly ser thr ala ser OPA thr ala gly phe arg thr pro arg thr leu ala gin cys 
481/161 511/171 

GTG CCC GCG AGC CTA CCG AAG ATC GCG TGC ATG CGT TCG GCG TGG ACC GCA CAG CAC CTG 
val pro ala ser leu pro lys ile ala cys met arg ser ala trp thr ala gin his leu 
541/181 571/191 

GAG TTG GCG GCG CCG AGG GCC GAG ATG GCA GGA TGA CGG ATC GTC GGG GGC GGG AAC TCC 
glu leu ala ala pro arg ala glu met ala gly OPA arg ile val gly gly gly asn ser 
601/201 631/211 

CAG GCC GCC GGA CCG TCG CAA ACC CGT CGC AAA CCC GTC GCA AAC CGT AAG GAG TCA TCC 
gin ala ala gly pro ser gin thr arg arg lys pro val ala asn arg lys glu ser ser 
661/221 691/231 

ATG AAG ACA GGC ACC GCG ACG ACG CGG CGC AGG CTG TTG GCA GTA CTG ATC GCC CTC GCG 
met lys thr giy thr ala thr thr arg arg arg leu leu ala val leu ile ala leu ala 
721/241 751/251 

TTG CCG GGG GCC GCC GTT GCG CTG CTG GCC GAA CCA TCA GCG ACC GGC GCG TCG GAC CCG 
leu pro gly ala ala val ala leu leu ala glu pro ser ala thr gly ala ser asp pro 
781/261 811/271 

TGC GCG GCC AGC GAA GTG GCG AGG ACG GTC GGT TCG GTC GCC AAG TCG ATG GGC GAC TAC 
cys ala ala ser glu val ala arg thr val gly ser val ala lys ser met gly asp tyr 
841/281 871/291 

CTG GAT TCA CAC CCA GAG ACC AAC CAG GTG ATG ACC GCG GTC TTG CAG CAG CAG GTA GGG 
leu asp ser his pro glu thr asn gin val met thr ala val leu gin gin gin val gly 
901/301 931/311 

CCG GGG TCG GTC GCA TCG CTG AAG GCC CAT TTC GAG GCG AAT CCC AAG GTC GCA TCG GAT 
pro gly ser val ala ser leu lys ala his phe glu ala asn pro lys val ala ser asp 



SEQ ID N° 1A' 
FIGURE 1A' 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



3/185 



Insert du clone contenant DP428, autre phase de lecture 
2/1 32/11 



ATC GCC 


TTT 


GAC 


GCC 


TAT 


TCG 


GTC 


GCG 


CAG 


CTT TTT 


GGC 


GAC 


Ul C 


ft r*rn 

ACT 


GGT 


GCC 


CGC 


GTT 


ile ala phe asp 


ala 


tyr 


ser 


val 


ala 


gin 


leu phe 


gly asp 


Vdl 


f Vi >- 

unr 


gly ala 


arg 


val 


62/21 


















92/31 
















GCG GGC 


GTC 


CAG 


CCG 


CAG 


CGA 


CAC 


CAC 


ATA 


CGG CCG 


GTC 


CGG 


I i(j 




GGG 


CCG 


TTG 


GGT 


ala gly val 


gin pro gin 


arg 


his 


his 


ile 


arg pro 


val 


arg 


leu 


arg 


gly pro 


leu 


gly 


122/41 


















152/51 














GGG GTT 


GGG 


TGC 


CTC 


CGT 


PAP 


CCC 


AGG 


CAG 


TTC GCT 


GGC 


TAT 


TTG 


TCG 


CAG 


TAG 


CGC 


GAC 


gly val 


gly cys 


leu 


arg 


his 


pro 


arg gin phe ala 


gly tyr 


leu 


ser 


gin AMB 


arg 


asp 


182/61 


















212/71 














GGC ATT 


GTC 


GAT 


GTC 


TTG 


GTA 


GCT 


AGC 


ATC 


CGG TCG 


GGG 


GGC 


CGC 


TAC 


CAG 


CGC 


CAG 


CGC 


gly ile 


val 


asp 


val 


leu 


val 


ala 


ser 


ile 


arg ser 


gly gly 


arg 


tyr 


gin 


arg 


gin 


arg 


242/81 


















272/91 










CGG GGC 


TCC 


CCG 


GTC 


CGG 


GTA 


GTG 


CGC 


GTC 


GAG TTG 


GTC 


GTG 


GAC 


CAG 


CAA 


TGA 


CTG 


CGA 


arg gly 


ser 


pro 


val 


arg 


val 


val 


arg 


val 


glu leu 


val 


val 


asp 


gin 


gin OPA 


ieu 


arg 


302/101 


















332/111 












CCC GGC 


GAC 


TTC 


GAA 


ACC 


GCC 


ACC 


GGT 


TAG 


ATT CCC 


CGA 


CTG 


CGT 


CAT 


CGC 


CAG 


GTA 


AAC 


pro gly asp 


phe 


glu thr 


ala 


thr gly AMB 


ile pro 


arg 


leu 


arg 


his 


arg 


gin 


val 


asn 


362/121 


















392/131 












CGC CGG 


CAC 


TAA 


CGC 


CAG 


CAA 


CCA ACC 


CGT 


GAA GAC 


CAA 


CCA 


ACG 


GCA 


CCT 


GCG 


CAG 


GTT 


arg arg 


his 


OCH 


arg gin gin pro 


thr 


arg glu asp 


gin 


pro 


thr 


ala 


pro 


ala 


gin 


val 


422/141 


















452/151 














GCG GCT 


CAA 


CCG 


CAT 


CAT 


GAA 


CTG 


CTG 


GAT 


TTC GGA 


CTC 


CCC 


GTA 


CTC 






AGT 


GCG 


ala ala 


gin pro 


his 


his 


glu leu leu 


asp phe gly leu 


pro 


val 


leu 


ser 


arg 


ser 


ala 


482/161 


















512/171 














TGC CCG 


CGA 


GCC 


TAC 


CGA 


AGA 


TCG 


CGT 


GCA 


TGC GTT 


CGG 


CGT 


GGA 


CCG 


CAC 


AGC 


ACC 


TGG 


cys pro 


arg 


ala 


tyr 


arg 


arg 


ser 


arg 


ala 


cys val 


arg 


arg 


gly pro 


his 


ser 


tnr 


trp 


542/181 


















572/191 
















AGT TGG 


CGG 


CGC 


CGA 


GGG 


CCG 


AGA 


TGG 


CAG 


GAT GAC 


GGA 


TCG 


TCG 


GGG 


GCG 


GGA 


ACT 


CCC 


ser trp 


arg 


arg 


arg 


gly pro 


arg 


trp 


gin 


asp asp gly 


ser 


ser 


gly 


ala 


gly 


nnr 


pro 


602/201 


















632/211 














AGG CCG 


CCG 


GAC 


CGT 


CGC 


AAA 


CCC 


GTC 


GCA AAC CCG 


TCG 


CAA 


ACC 


GTA 


AGG 


AGT 


CAT 


CCA 


arg pro 


pro 


asp 


arg 


arg 


lys 


pro 


val 


ala 


asn pro 


ser 


gin 


thr 


val 


arg 


ser 


his 


pro 


662/221 


















692/231 














TGA AGA 


CAG 


GCA 


CCG 


CGA 


CGA 


CGC 


GGC 


GCA 


GGC TGT 


TGG 


CAG 


TAC 


TGA 


TCG 


CCC 


TCG 


CGT 


OPA arg gin 


ala 


pro 


arg 


arg 


arg 


gly 


ala 


gly cys 


trp gin 


tyr 


OPA 


ser 


pro 


ser 


arg 


722/241 


















752/251 














TGC CGG 


GGG 


CCG 


CCG 


TTG 


CGC 


TGC 


TGG 


CCG 


AAC CAT 


CAG 


CGA 


CCG 


GCG 


CGT 


CGG 


ACC 


CGT 


cys arg gly pro 


pro 


leu 


arg 


cys 


trp 


pro 


asn his 


gin 


arg 


pro 


ala 


arg 


arg 


thr 


arg 


782/261 


















812/271 












GCG CGG 


CCA 


GCG 


AAG 


TGG 


CGA 


GGA 


CGG 


TCG 


GTT CGG 


TCG 


CCA 


AGT 


CGA 


TGG 


GCG 


ACT 


ACC 


ala arg 


pro 


ala 


lys 


trp 


arg 


gly 


arg 


ser 


val arg 


ser 


pro 


ser 


arg 


trp 


ala 


thr 


thr 


842/281 


















872/291 
















TGG ATT 


CAC 


ACC 


CAG 


AGA 


CCA 


ACC 


AGG 


TGA 


TGA CCG 


CGG 


TCT 


TGC 


AGC 


AGC 


AGG 


TAG 


GGC 


trp ile 


his 


thr 


gin 


arg 


pro 


thr 


arg 


OPA 


OPA pro 


arg 


ser 


cys 


ser 


ser 


arg 


AM3 


gly 


902/301 


















932/311 














CGG GGT 


CGG 


TCG 


CAT 


CGC 


TGA 


AGG 


CCC 


ATT 


TCG AGG 


CGA 


ATC 


CCA 


AGG 


TCG 


CAT 




ATC 


arg gly 


arg 


ser 


his 


arg 


OPA 


arg 


pro 


ile 


ser arg 


arg 


ile 


pro 


arg 


ser 


his 


arg 


ile 



SEQ ID N° IB' 
FIGURE IB* 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



4/185 



SeqlC: Insert du clone DP428, autre phase de lecture 
3/1 33/11 

TCG CCT TTG ACG CCT ATT CGG TCG CGC AGC TTT TTG GCG ACG TCA CTG GTG CCC GCG TTG 
ser pro leu thr pro ile arg ser arg ser phe leu ala thr ser leu val pro ala leu 
63/21 93/31 

CGG GCG TCC AGC CGC AGC GAC ACC ACA TAC GGC CGG TCC GGT TGC GGG GGC CGT TGG GTG 
arg ala ser ser arg ser asp thr thr tyr gly arg ser gly cys gly gly arg trp val 
123/41 153/51 

GGG TTG GGT GCC TCC GTC ACC CCA GGC AGT TCG CTG GCT ATT TGT CGC AGT AGC GCG ACG 
gly leu gly ala ser val thr pro gly ser ser leu ala ile cys arg ser ser ala thr 
183/61 213/71 

GCA TTG TCG ATG TCT TGG TAG CTA GCA TCC GGT CGG GGG GCC GCT ACC AGC GCC AGC GCC 
ala leu ser met ser trp AMB leu ala ser gly arg gly ala ala thr ser ala ser ala 
243/81 273/91 

GGG GCT CCC CGG TCC GGG TAG TGC GCG TCG AGT TGG TCG TGG ACC AGC AAT GAC TGC GAC 
gly ala pro arg ser gly AMB cys ala ser ser trp ser trp thr ser asn aso cys asp 
303/101 333/111 

CCG GCG ACT TCG AAA CCG CCA CCG GTT AGA TTC CCC GAC TGC GTC ATC GCC AGG TAA ACC 
pro ala thr ser lys pro pro pro val arg phe pro asp cys val ile ala arg OCH thr 
363/121 393/131 

GCC GGC ACT AAC GCC AGC AAC CAA CCC GTG AAG ACC AAC CAA CGG CAC CTG CGC AGG TTG 
ala gly thr asn ala ser asn gin pro val lys thr asn gin arg his leu arg arg leu 
423/141 453/151 

CGG CTC AAC CGC ATC ATG AAC TGC TGG ATT TCG GAC TCC CCG TAC TCT CGC GCA GTG CGT 
arg leu asn arg ile met asn cys trp ile ser asp ser pro tyr ser arg ala val arg 
483/161 513/171 

GCC CGC GAG CCT ACC GAA GAT CGC GTG CAT GCG TTC GGC GTG GAC CGC ACA GCA CCT GGA 
ala arg glu pro thr glu asp arg val his ala Dhe gly val asp arg thr ala Dro gly 
543/181 . 573/191 

GTT GGC GGC GCC GAG GGC CGA GAT GGC AGG ATG ACG GAT CGT CGG GGG CGG GAA CTC CCA 
val gly gly ala glu gly arg asp gly arg met thr aso arg arg gly arg glu leu pro 
603/201 633/211 

GGC CGC CGG -ACC GTC GCA AAC CCG TCG CAA ACC CGT CGC AAA CCG TAA GGA GTC ATC CAT 
gly arg arg thr val ala asn pro ser gin thr arg arg lys pro OCH gly val ile his 
663/221 693/231 

GAA GAC AGG CAC CGC GAC GAC GCG GCG CAG GCT GTT GGC AGT ACT GAT CGC CCT CGC GTT 
glu asp arg his arg asp asp ala ala gin ala val gly ser thr asp arg pro arg val 
723/241 753/251 

GCC GGG GGC CGC CGT TGC GCT GCT GGC CGA ACC ATC AGC GAC CGG CGC GTC GGA CCC GTG 
ala gly gly arg arg cys ala ala gly arg thr ile ser asp arg arg val gly pro val 
783/261 813/271 

CGC GGC CAG CGA AGT GGC GAG GAC GGT CGG TTC GGT CGC CAA GTC GAT GGG CGA CTA CCT 
arg gly gin arg ser gly glu asp gly arg phe gly arg gin val asp gly arg leu oro 
843/281 873/291 

GGA TTC ACA CCC AGA GAC CAA CCA GGT GAT GAC CGC GGT CTT GCA GCA GCA GGT AGG GCC 
gly phe thr pro arg asp gin pro gly asp asp arg gly leu ala ala ala glv arg ala 
903/301 933/311 

GGG GTC GGT CGC ATC GCT GAA GGC CCA TTT CGA GGC GAA TCC CAA GGT CGC ATC GGA TC 
gly val gly arg ile ala glu gly pro phe arg gly glu ser gin gly arg ile gly 



SEQ ID N° 1C 
FIGURE 1C 

FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



5/185 



Sequence codante DP428 identique a la sequence Rv0203 predite par Cole et al. 
(Nature 393:537-544) 

1/1 31/11 



ATG AAG 


ACA 


GGC 


ACC 


GCG 


ACG 


ACG 








1 1 L> 


re* a 


bxA 


CTG 


ATC 


GCC 


CTC 


GCG 


Met lys 


thr 




thr 


ala 


thr 


thr 


a Tit 

ui.^ 




arg leu 


leu 


aia 


,.-1 

val 


leu 


ile 


ala 


leu 


ala 


OX/ £ X 


















y x/ o i 




















GGG 






\3 L 1 


(ICC 




Lib 






1 CA 


GCG 


ACC 


GGC 


GCG 


TCG 


GAC 


CCG 


XC U JL W 


gxy 


ala 


aid 


vet J. 


aXa 


loll 


leu 


aid 


glu pro 


ser 


ala 


thr 


gly 


ala 


ser 


asp 


pro 


191 / A 1 
XZ X/ 4 X 


















1 CI /CI 












TGC GCG 


GCC 


AGC 


GAA 


GTG 


GCG 


AGG 


ACG 


\J X I* 


UVjI ICVj 




(jLC 


AAG 


TCG 


ATG 


GGC 


GAC 


TAC 


uyo ex x d 


al a 
axa 


co r 
3Ci 




va 1 


a X a 


a rg 


unr 


t/a 1 
Val 


gly ser 


val 


ala 


lys 


ser 


met 


gly asp 


tyr 


1 ft 1 / £1 
X D X/ OX 


















Oil / 1 1 

211/71 
















L. 1 vj V» t\ L 










ALL. 


nap 


LAb 




ATG ACC 


GCG 


GTC 


TTG 


CAG 


CAG 


CAG 


GTA 


GGG 


leu asp 


ser 


his 


oro 


alu 


thr 


asn 


aln 


val 


met thr 


ala 


wa 1 

val 


leu 


gin gin 


gin 


val 


gly 


241/81 


















271/91 














CCG GGG 


TCG 


GTC 


GCA 


TCG 


CTG 


AAG 


GCC 


CAT 


TTC GAG 


GCG 


AAT 


CCC 


AAG 


GTC 


GCA 


TCG 


GAT 


pro gly 


ser 


val 


ala 


ser 


leu 


lys 


ala 


his 


phe glu 


ala 


asn 


pro 


lys 


val 


ala 


ser 


asp 


301/101 


















331/111 












CTG CAC 


GCG 


CTT 


TCG 


CAA 


CCG 


CTG 


ACC 


GAT 


CTT TCG 


ACT 


CGG 


TGC 


TCG 


CTG 


CCG 


ATC 


AGC 


leu his 


ala 


leu 


ser 


gin 


pro 


leu 


thr 


asp 


leu ser 


thr 


arg 


cys 


ser 


leu 


pro 


ile 


ser 


361/121 


















391/131 














GGC CTG 


CAG 


GCG 


ATC 


GGT 


TTG 


ATG 


CAG 


GCG 


GTG CAG 


GGC 


GCC 


CGC 


CGG 


TAG 








gly leu 


gin 


ala 


ile 


gly 


leu 


met 


gin 


ala 


val gin 


gly 


ala 


arg 


arg 


AMB 









SEQ ID N° ID 



FIGURE ID 



ORF contenant la sequent 
1/1 

TGA CGG ATC GTC GGG GGC 
OPA arg ile val gly gly 
61/21 

CCC GTC GCA AAC CGT AAG 
pro val ala asn arg lys 
121/41 

CTG TTG GCA GTA CTG ATC 
leu leu ala val leu ile 
181/61 

CCA TCA GCG ACC GGC GCG 
pro ser ala thr gly ala 
241/81 

TCG GTC GCC AAG TCG ATG 
ser val ala lys ser met 
301/101 

ACC GCG GTC TTG CAG CAG 
thr ala val leu gin gin 
361/121 

GAG GCG AAT CCC AAG GTC 
glu ala asn pro lys val 
421/141 

TCG ACT CGG TGC TCG CTG 
ser thr arg cys ser leu 
481/161 

CAG GGC GCC CGC CGG TAG 
gin gly ala arg arg AMB 



DP428 et faisant partie 
31/11 



GGG 


AAC 


TCC 


CAG 


GCC GCC 


GGA 


gly 


asn 


ser 


gin 


ala ala 


gly 










91/31 




GAG 


TCA 


TCC 


ATG 


AAG ACA 


GGC 


glu 


ser 


ser 


met 


lys thr 


gly 










151/51 




GCC 


CTC 


GCG 


TTG 


CCG GGG 


GCC 


ala 


leu 


ala 


leu 


pro gly 


ala 










211/71 




TCG 


GAC 


CCG 


TGC 


GCG GCC 


AGC 


ser 


asp 


pro 


cys 


ala ala 


ser 










271/91 




GGC 


GAC 


TAC 


CTG 


GAT TCA 


CAC 


gly 


asp 


tyr 


leu 


asp ser 


his 










331/111 




CAG 


GTA 


GGG 


CCG 


GGG TCG 


GTC 


gin 


val 


gly 


pro 


gly ser 


val 










391/131 




GCA 


TCG 


GAT 


CTG 


CAC GCG 


CTT 


ala 


ser 


asp 


leu 


his ala 


leu 










451/151 




CCG 


ATC 


AGC 


GGC 


CTG CAG 


GCG 


pro 


ile 


ser 


gly 


leu gin 


ala 



i seqlA 1 

CCG TCG CAA ACC CGT CGC AAA 
pro ser gin thr arg arg lys 

ACC GCG ACG ACG CGG CGC AGG 
thr ala thr thr arg arg arg 

GCC GTT GCG CTG CTG GCC GAA 
ala val ala leu leu ala glu 

GAA GTG GCG AGG ACG GTC GGT 
glu val ala arg thr val gly 

CCA GAG ACC AAC CAG GTG ATG 
pro glu thr asn gin val met 

GCA TCG CTG AAG GCC CAT TTC 
ala ser leu lys ala his phe 

TCG CAA CCG CTG ACC GAT CTT 
ser gin pro leu thr asp leu 

ATC GGT TTG ATG CAG GCG GTG 
ile gly leu met gin ala val 



SEQ ID N° IF 
FEUILLE DE REM^SS^E^!? (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



6/185 



4 91 CCGGTCGGGGGGCCGCTACCAGCGCCAGCGCCGGGGCTCCCCGGTCCGGGTA GTG CGC GTC GAG TTG GTC GTG 563 
1 VRVELVV7 



5c |3acttcgaaaccgccaccggttagattccccgactgcgtcatcg| :cag 



564 GAC CAG CAA TGA CTGCGACCCGGCpACTTCGAAACCGCCACCGGTTAGATTCCCCGACTGCGTCATCGpCAGGTAA 639 
8 D Q Q * 

640 ACCGCCGGCACTAACGCCAGCAACCAACCC GTG AAG ACC AAC CAA CGG CAC CTG CGC AGG TTG CGG 7 05 
1 V KTNQRHLRRLR12 

706 CTC AAC CGC ATC ATG AAC TGC TGG ATT TCG GAC TCC CCG TAC TCT CGC GCA GTG CGT GCC 7 65 
13LNR IMNCW I SDS PYSRAVRA 32 



766 
33 


CGC 
R 


GAG 
E 


CCT 
P 


ACC 
T 


GAA 
E 


GAT 
D 


CGC 
R 


GTG 
V 


CAT 
H 


GCG 
A 


TTC 
F 


GGC 
G 


GTG 
V 


GAC 
D 


CGC 
R 


ACA 
T 


GCA 
A 


CCT GGA 
P G 


GTT 
V 


825 
52 


826 
53 


GGC 
G 


GGC 
G 


GCC 
A 


GAG 
E 


GGC 
G 


CGA 
R 


GAT 
D 


GGC 
G 


AGG 
R 


ATG 
M 


ACG 
T 


GAT 
D 


CGT 
R 


CGG 
R * 


GGG 
G 


CGG 
R 


GAA 
E 


CTC CCA 
L P 


GGC 
G 


885 
72 


836 
' j 


CGC 

K 


CGG 

p 
ft 


ACC 
T 


GTC 

y 


GCA 


AAC 
N 


CCG 
p 


TCG 


CAA 

V 


ACC 

T 
l 


CGT 
R 


CGC 
R 


AAA 

i\ 


CCG 


TAA GGAGTCATCC ATG AAG 
* x:< :<:<:<:< M K 


946 


947 
3 


ACA 
T 


GGC 


ACC 
T 


GCG 


ACG 
T 


ACG 
T 


CGG 


CGC 


AGG 


CTG 
L 


TTG 
L 


GCA 
A 


GTA 


CTG 
L 


ATC 

I 


GCC 
A 


CTC 
L 


GCG TTG 
A L 


CCG 
P 


1006 


1007 
23 


GGG 
G 


GCC 
A 


GCC 
A 


GTT 
V 


GCf 
A 


CTG 
L 


CTG 
L 


GCC 
A 


GAA 
E 


CCA 
P 


TCA 
S 


GCG 
A 


ACC 
T 


GGC 
G 


GCG 
A 


TCG 
S 


GAC 
D 


CCG TGC 
P C 


GCG 
A 


1066 
42 


1067 
43 


GCC 
A 


AGC 
S 


GAA 


GTG 
V 


GC€ 
A 


AGG 
R 


ACG 
T 


GTC 
V 


GGT 
G 


TCG 
S 


GTC 
V 


GCC 
A 


AAG 

K 


TCG 
S 


ATG 
M 


GGC 
G 


GAC 
D 


TAC CTG 
Y L 


GAT 
D 


1126 
62 


1127 
63 


TCA 
S 


CAC 
H 


CCA 
P 


GAG 
E 


ACC 
T 


AAC 
N 


CAG 
Q 


GTG 
V 


ATG 
M 


ACC 
T 


GCG 
A 


GTC 
V 


TTG 
L 


CAG 
Q 


CAG 
Q 


CAG 
Q 


GTA 
V 


GGG CCG 
G P 


GGG 
G 


1186 
82 


1197 
83 


TCG 
S 


GTC 
V 


GCA 
A 


TCG 
S 


CTG 
L 


AAG 
K 


GCC 
A 


CAT 
H 


TTC 
F 


GAG 

£ 


GCG- AAT 
A N 


CCC 
p 


AAG 
K 


GTC 
V 


GCA 
A 


TCG 
S 


GAT CTG 
D L 


CAC 
H 


1246 
102 


1247 


GCG 


CTT 


TCG 


CAA 


CCG 


CTG 


ACC 


GAT 


CTT 


TCG 


ACT 


CGG 


TGC 


TCG 


CTG 


CCG 


ATC 


AGC GGC 


CTG 


13C5 


103 


A 


L 


S 


Q 


P 


L 


T 


D 


L 


S 


T 


R 


C 


S 


l L 


P 


T 


S I G | 


L 


122 


1307 
123 


CAG 
Q 


GCG 
A 


ATC 
I 


GGT 
G 


TTG 
L 


ATG 
M 


CAG 
Q 


GCG 
A 


GTG 
V 


CAG 
Q 


GGC 
G 


GCC 
A 


CGC 
R 


CGG 

«l 


TAG 


ATG CO 
M P 


3 GAC CGC CGC 
D R R 


1366 
5 


1367 
6 


CGG 
R 


GTC 
V 


CGG 
R 


CGC 
R 


AGT 
S 


CGA 
R 


CGT 
R 


GAG 
£ 


GCA 
A 


GCG 
A 


GTC 
V 


GCC 
A 


TAC 
Y 


CGG 
R 


GGC 
G 


GGT 
G 


GTC 
V 


TCG CCG 
S P 


CCT 
p 


1426 
25 


1427 
26 


TCT 
S 


GGT 
G 


CGC 
R 


AGG 
R 


TCA 

S 


GGG 
G 


GTC 
V 


GGC 
G 


GCT 
A 


GGA 
G 


CCT 
P 


TGC 
C 


GGT 
G 


GTG 
V 


GTT 
V 


TCG 
S 


ACC 
T 


GGG TCG 
G S 


TCG 

S 


1436 
45 


1437 
46 


CAG 
Q 


GGT 
G 


GTG 
V 


CCC 
P 


TGC 

C 


GGT 
G 


TGG 
W 


ATG 
M 


ACA 
T 


AGT 
S 


CGC 
R 


AGG 
R 


TTT 
F 


GGA 
G 


TCG 
S 


GTT 
V 


GGC 
G 


GGG TCG 
G S 


CGA 
R 


1545 
65 



15-57 TCG TTG T 1553 
66 5 L 6™ 



SEQ ID N° 2 
FIGURE 2 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



7/185 



PCT/FR98/01813 



31/11 



TCG CCG 


GCT 


CGC GGA 


CGT 


AGA 


TAA 


TAG 


CTC 


ACC GTT 


obn 


ff a 




ff a 


LAG 


GGT 


CCT 


TTG 


ser pro 


ala 


arg gly 


arg 


arg 


OCH 


AMB 


leu 


thr val 


giy 


arg 


pro 


arg 


gin 


gly 


pro 


i «... 
leu 


61/21 
















91/31 










TGA CTG 


CCG 


GGC TTG 


ACG 


CGG 


ACG 




ALA 




GGT 


CAT 


CGC 


CTA 


AGG 


CTA 


CCG 


TTC 


OPA leu 


pro 


gly leu thr 


arg 


thr 




1-hr 

LIU 


/fill 0 A *• 

yiu ser 


gly 


nis 


arg 


leu 


arg 


leu 


pro 


phe 


121/41 
















151/51 










TGA CCT 


GGG 


GTG CGT 


GGG 


CGC 


CGA 


CGA 


GTG 


AGG CAG 


TCA 


I VJ 1 




Tiff 


ffr* 


CAC 


CGC 


CAC 


OPA pro 


gly 


val arg gly arg 


arg 


arg 


val 


arg gin 


ser 


cys 


leu 


arg 


ala 


his 


arg 


his 


181/61 
















211/71 














CTC GGT 


CGC 


CGG CAG 


TGT 


CAG 


CAT 


GTG 


CAG 


ATG ACT 


CCA 


CGC 


AGC 


TTG 


TTC 


GTG 


TTG 


GTG 


leu qly arq 


arq qln 


cys 


gin his 


val 


gin 


met thr 


pro 


arg 


ser 


leu 


phe 


val 


leu 


val 


241/81 
















271/91 














TCG TGG 


TTG 


CGA CGA 


CTT 


GGC 


GCT 


GGT 


GAG 


CGC ACC 


CGC 


CGG 


CGT 


CGT 


GCC 


GCG 


CAT 


GCG 


ser trp 


leu 


arg arg 


leu 


gly 


ala 


gly 


glu 


arg thr 


a i. y 


arg 


arg 


a rg 


aia 


aia 


nis 


ala 


301/101 




























GAT C 


































asp 














































SEQ ID N° 3A 






























FIGURE 3A 


































32/11 


















CGC CGG 


CTC 


GCG GAC 


GTA 


GAT 


AAT 


AGC 


TCA 


CCG TTG 




TAP 




GAC 


AGG 


GTC 


CTT 


TGT 


arg arg 


leu 


ala asp 


val 


asp 


asn 


ser 


ser 


pro leu 


asp 


asp 


1 eu 


asp 


arg 


val 


leu 


cys 


62/21 
















92/31 














GAC TGC 


CGG 


GCT TGA 


CGC 


GGA 


CGA 


CCA 


CAG 


AGT CGG 


b I C 


ATC 


GCC 


TAA 


GGC 


TAC 


CGT 


TCT 


asp cys 


arg 


ala OPA 


arg 


gly 


arg 


pro 


gin 


ser arg 


val 


ile 


ala 


OCH 


gly 


tyr 


arg 


ser 


122/41 
















152/51 












GAC CTG 


GGG 


TGC GTG 


GGC 


GCC 


GAC 


GAG 


TGA 


GGC AGT 


CAT 


GTC 


TCA 


GGG 


CCC 


ACC 


GCC 


ACC 


asp leu 


gly 


cys val 


gly 


ala 


asp glu 


OPA 


gly ser 


his 


val 


ser 


gly pro 


thr 


ala 


thr 


182/61 
















212/71 


















TCG GTC 


GCC 


GGC AGT 


GTC 


AGC 


ATG 


TGC 


AGA 


TGA CTC 


CAC 


GCA 


GCT 


TGT 


TCG 


TGT 


TGG 


TGT 


ser val 


ala 


gly ser 


val 


ser 


met 


cys 


arg 


OPA leu 


his 


ala 


ala 


cys 


ser 


cys 


trp 


cys 


242/81 
















272/91 












CGT GGT 


TGC 


GAC GAC 


TTG 


GCG 


CTG 


GTG 


AGC 


GCA CCC 


GCC 


GGC 


GTC 


GTG 


CCG 


CGC 


ATG 


CGG 


arg gly 


cys 


asp asp 


leu 


ala 


leu 


val 


ser 


ala pro 


ala 


gly val 


val 


pro 


arg 


met 


arg 


302/101 































ATC 
ile 



SEQ ID N° 3B 
FIGURE 3B 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



8/185 



33/11 



GCC GGC 


TCG 


CGG 


ACG 


TAG 


ATA ATA 


GCT 


CAC 


CGT TGG 


ACC 


acc 




ACA 


GGG 


I 


TTT 


GTG 


ala gly 


ser 


arg 


thr 


AMB 


lie 


lie 


ala 


hi s 


a rrr t~ rn 
ai. y l. i. y 


1-hr 


th r 

tnc 


ser 


thr gly 


ser 


phe 


val 


63/21 


































ACT GCC 


GGG 


CTT 


GAC 


GCG 


GAC 


GAC 


CAC 


AGA 










AAG 


GCT 


ACC 


GTT 


CTG 


thr ala 


gly 


leu 


asp 


ala 


asp 


asp 


his 


arg 


val gly 


ser 


ser 


pro 


lys 


ala 


thr 


val 


leu 


123/41 


















153/51 
















ACC TGG 


GGT 


GCG 


TGG 


GCG 


CCG 


ACG 


AGT 


GAG 


GCA GTC 


ATG 


TCT 


CAG 


GGC 


CCA 


CCG 


CCA 


CCT 


thr trp gly ala trp 


ala 


pro 


thr 


ser 


glu 


ala val 


met 


ser 


gin 


gly pro 


pro 


pro 


pro 


183/61 


















213/71 












CGG TCG 


CCG 


GCA 


GTG 


TCA 


GCA 


TGT 


GCA 


GAT 


GAC TCC 


ACG 


CAG 


CTT 


GTT 


CGT 


GTT 


GGT 


GTC 


arg ser 


pro 


ala 


val 


ser 


ala 


cys 


ala 


asp 


asp ser 


thr 


gin 


leu 


val 


arg 


val 


gly val 


243/81 


















273/91 
















GTG GTT 


GCG 


ACG 


ACT 


TGG 


CGC 


TGG 


TGA 


GCG 


CAC CCG 


CCG 


GCG 


TCG 


TGC 


CGC 


GCA 


TGC 


GGA 


val val 


ala 


thr 


thr 


trp 


arg 


trp 


OPA 


ala 


his pro 


pro 


ala 


ser 


cys 


arg 


ala 


cys 


gly 



TC 



SEQ ID N° 3C 
FIGURE 3C 





















31/11 


















CCA ATT 


TTC 


CTT 


CGC 


GCC 


GTG 


CAA 


TAC 


CAT 


CTG CAA 


GAC 


CAG 


CGA 


CGG 


CCC 


GTG 


GTT 


GCG 


pro ile 
61/21 


phe 


leu 


arg 


ala 


val 


gin 


tyr 


his 


leu gin 
91/31 


asp 


gin 


arg 


arg 


pro 


val 


val 


ala 


GTC GCG 


CAG 


CTT 


GCG 


GAA 


ACC 


GGG 


TAT 


GGA 


CCC TGC 


CGT 


ACC 


GTT 


GTT 


GCC 


ACT 


TGA 


TGT 


val ala 
121/41 


gin 


leu 


ala 


glu 


thr 


gly 


tyr 


gly 


pro cys 
151/51 


arg 


thr 


val 


val 


ala 


thr 


OPA 


cys 


CGT CGC 


TCT 


CCA 


CCC 


GTC 


GGG 


GGG 


CGA 


AAG 


CCA TTC 


CGA 


CAC 


TGG 


GAT 


CCT 


CAA 


AAC 


GTC 


arg arg 
181/61 


ser 


pro 


pro 


val 


gly gly 


arg 


lys 


pro phe 
211/71 


arg 


his 


trp 


asp 


pro 


gin 


asn 


val 


GGC TGA 


GTG 


TCT 


GCA 


GGG 


CTC 


CGG 


GGA 


GCA 


GCC GAT 


CAT 


CAC 


CAT 


GTA 


CGA 


ACT 


GAA 


TAA 


gly OPA val 
241/81 


ser 


ala 


gly 


leu 


arg 


gly 


ala 


ala asp 
271/91 


his 


his 


his 


val 


arg 


thr 


glu 


OCH 


GTC CCC 


CGC 


GCG 


CGA 


CTT 


CCA 


GAC 


ATT 


TGT 


TGT GGT 


TTC 


GGT 


TGA 


GGC 


CGA 


GGC 


GAG 


GCT 


val pro 
301/101 


arg 


ala 


arg 


leu 


pro 


asp 


ile 


cys 


cys gly 
331/111 


phe 


gly 


OPA 


gly 


arg 


gly 


glu 


ala 


CAT TTC 


GCA 


GCA 


ACC 


GGT 


CTC 


CGG 


GTC 


GCA 


GCA TCG 


TTG 


CGG 


CGA 


TCG 


CGG 


CGC 


AGT 


CGT 


his phe 
361/121 


ala 


ala 


thr 


gly 


leu 


arg 


val 


ala 


ala ser 


leu 


arg 


arg 


ser 


arg 


arg 


ser 


arg 


CGG ACG 


AGT 


CGT 


CGT 


CAA 


CGA 


CCA 


CGA 


TC 




















arg thr 


ser 


arg 


arg 


gin 


arg 


pro 


arg 























SEQ ID N° 4A 
FIGURE 4A 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



9/185 



PCT/FR98/01813 

















32/11 
















CAA TTT 


TCC 


TTC 


GCG CCG 


TGC 


AAT ACC 


ATC 


TGC AAG 


ACC 


AGC 


GAC 


GGC CCG 


TGG 


TTG 


CGG 


gin phe 


ser phe 


ala pro 


cys 


asn thr 


ile 


cys lys 


thr 


ser 


asp gly pro 


trp 


leu 


arg 


62/21 














92/31 












TCG CGC 


AGC 


TTG 


r* n n n 

CGG AAA 


CCG 


GGT ATG 


GAC 


CCT GCC 


GTA 


CCG 


TTG 


TTG CCA 


CTT 


GAT 


GTC 


ser arg 


ser 


leu 


arg lys 


pro 


gly met 


asp 


pro ala 


val 


pro 


leu 


leu pro 


leu 


asp 


val 


122/41 














152/51 












GTC GCT 


CTC 


CAC 


CCG TCG 


GGG 


GGC GAA 


AGC 


CAT TCC 


GAC 


ACT 


GGG 


ATC CTC 


AAA 


ACG 


TCG 


val ala 


leu 


his 


pro ser 


gly gly glu 


ser 


his ser 


asp 


thr 


gly 


ile leu 


lys 


thr 


ser 


182/61 














212/71 












GCT GAG 


TGT 


CTG 


CAG GGC 


TCC 


GGG GAG 


CAG 


CCG ATC 


ATC 


ACC 


ATG 


TAC GAA 


CTG 


AAT 


AAG 


ala glu 


cys 


leu 


gin gly 


ser 


gly glu 


gin 


pro ile 


ile 


thr 


met 


tyr glu 


leu 


asn 


lys 


242/81 














272/91 












TCC CCC 


GCG 


CGC 


GAC TTC 


CAG 


ACA TTT 


GTT 


GTG GTT 


TCG 


GTT 


GAG 


GCC GAG 


GCG 


AGG 


CTC 


ser pro 


ala 


arg 


asp phe 


gin 


thr phe 


val 


val val 


ser 


val 


glu 


ala glu 


ala 


arg 


leu 


302/101 














332/111 












ATT TCG 


CAG 


CAA 


CCG GTC 


TCC 


GGG TCG 


CAG 


CAT CGT 


TGC 


GGC 


GAT 


CGC GGC 


GCA 


GTC 


GTC 


ile ser 


gin 


gin pro val 


ser 


gly ser 


gin 


his arg 


cys 


gly 


asp 


arg gly 


ala 


val 


val 


362/121 


























GGA CGA 


GTC 


GTC 


GTC AAC 


GAC 


CAC GAT 


C 


















gly arg 


val 


val 


val asn 


asp 


his asp 





















SEQ ID N° 4B 
FIGURE 4B 



33/11 



AAT TTT 


CCT 


TCG 


CGC 


CGT 


GCA 


ATA 


CCA 


TCT 


GCA AGA 


CCA 


GCG 


ACG 


GCC 


CGT 


GGT 


TGC 


GGT 


asn phe pro 
63/21 


ser 


arg 


arg 


ala 


ile 


pro 


ser 


ala arg 
93/31 


pro 


ala 


thr 


ala 


arg 


gly 


cys 


gly 


CGC GCA 


GCT 


TGC 


GGA 


AAC 


CGG 


GTA 


TGG 


ACC 


CTG CCG 


TAC 


CGT 


TGT 


TGC 


CAC 


TTG 


ATG 


TCG 


arg ala 
123/41 


ala 


cys 


gly 


asn 


arg 


val 


trp 


thr 


leu pro 
153/51 


tyr 


arg 


cys 


cys 


his 


leu 


met 


ser 


TCG CTC 


TCC 


ACC 


CGT 


CGG 


GGG 


GCG 


AAA 


GCC 


ATT CCG 


ACA 


CTG 


GGA 


TCC 


TCA 


AAA 


CGT 


CGG 


ser leu 
183/61 


ser 


thr 


arg arg gly 


ala 


lys 


ala 


ile pro 
213/71 


thr 


leu 


gly 


ser 


ser 


lys 


arg 


arg 


CTG AGT 


GTC 


TGC 


AGG 


GCT 


CCG 


GGG 


AGC 


AGC 


CGA TCA 


TCA 


CCA 


TGT 


ACG 


AAC 


TGA 


ATA 


AGT 


leu ser 
243/81 


val 


cys 


arg 


ala 


pro 


gly 


ser 


ser 


arg ser 
273/91 


ser 


pro 


cys 


thr 


asn 


OPA 


ile 


ser 


CCC CCG 


CGC 


GCG 


ACT 


TCC 


AGA 


CAT 


TTG 


TTG 


TGG TTT 


CGG 


TTG 


AGG 


CCG 


AGG 


CGA 


GGC 


TCA 


pro pro 
303/101 


arg 


ala 


thr 


ser 


arg 


his 


leu 


leu 


trp phe 
333/111 


arg 


leu 


arg 


pro 


arg 


arg 


gly 


ser 


TTT CGC 


AGC 


AAC 


CGG 


TCT 


CCG 


GGT 


CGC 


AGC 


ATC GTT 


GCG 


GCG 


ATC 


GCG 


GCG 


CAG 


TCG 


TCG 


phe arg 
363/121 


ser 


asn 


arg 


ser 


pro 


gly 


arg 


ser 


ile val 


ala 


ala 


ile 


ala 


ala 


gin 


ser 


ser 


GAC GAG 


TCG 


TCG 


TCA 


ACG 


ACC 


ACG 


ATC 






















asp glu 


ser 


ser 


ser 


thr 


thr 


thr 


ile 























SEQ ID N° 4C 
FEUILLE DE REMpOffi&tff (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



10/185 



partie de la sequence nucleotidique de seq4A 

1/1 31/11 

CCG CGC GCG ACT TCC AGA CAT TTG TTG TGG TTT CGG TTG AGG CCG AGG CGA GGC TCA TTT 

pro arg ala thr ser arg his leu leu trp phe arg leu arg pro arg arg gly ser phe 

61/21 91/31 

CGC AGC AAG CGG TCT CCG GGT CGC AGC ATC GTT GCG GCG ATC GCG GCG CAG TCG TCG GAC 

arg ser lys arg ser pro gly arg ser ile val ala ala ile ala ala gin ser ser asp 
121/41 

GAG TCG TCG TCA ACG ACC ACG ATC 
glu ser ser ser thr thr thr ile 



SEQ ID N° 4A' 
FIGURE 4A' 



1/1 

CGC GCG CGA CTT CCA GAC ATT 
arg ala arg leu pro asp ile 
61/21 

GCA GCA AGC GGT CTC CGG GTC 
ala ala ser gly leu arg val 
121/41 

AGT CGT CGT CAA CGA CCA CGA 
ser arg arg gin arg pro arg 



31/11 

TGT TGT GGT TTC GGT TGA 
cys cys gly phe gly OPA 
91/31 

GCA GCA TCG TTG CGG CGA 
ala ala ser leu arg arg 

TC 



SEQ ID N° 4B f 
FIGURE 4B' 



GGC CGA GGC GAG GCT CAT TTC 
gly arg gly glu ala his phe 

TCG CGG CGC AGT CGT CGG ACG 
ser arg arg ser arg arg thr 



1/1 

GCC GCG CGC GAC TTC CAG ACA TTT GTT GTG 

ala ala arg asp phe gin thr phe val val 
61/21 

TCG CAG CAA GCG GTC TCC GGG TCG CAG CAT 

ser gin gin ala val ser gly ser gin his 
121/41 

CGA GTC GTC GTC AAC GAC CAC GAT C 

arg val val val asn asp his asp 



31/11 

GTT TCG GTT GAG GCC GAG GCG AGG CTC ATT 
val ser val glu ala glu ala arg leu ile 
91/31 

CGT TGC GGC GAT CGC GGC GCA GTC GTC GGA 
arg cys gly asp arg gly ala val val gly 



SEQ ID N° 4C 
FIGURE 4C 

FEUILLE DE REMPLACEMENT (RE6LE 26) 



WO 99/09186 



PCT/FR98/01813 



11 



ORF d'apres par Cole et al . (Nature 

4A 1 

1/1 



tga ata 


agt 


ccg 


ccg 


cac 


crca 


act 


tec 


aaa 


OPA ile 


ser 


pro 


pro 


arg 


ala 


thr 




A T" IT 


61/21 


















caa acre 


tea 


ttt 


cgc 


age 


aag 


caa 


tct 


rrn 

*-*-y 


ara alv 


ser 


phe 


arg 


ser 


lys 


arg 


ser 


pro 


121/41 


















caa tea 


tea 


gac 


gag 


tea 


teg 


tea 


acg 


acc 


gin ser 


ser 


asp glu 


ser 


ser 


ser 


thr 


thr 


181/61 


















agg atg 


eta 


cgc 


aga 


cag 


cgc 


teg 


atg 


gtg 


arg met 


leu 


arg 


arg 


gin 


arg 


ser 


met 


val 


241/81 


















gag ata 


age 


ggt 


ttc 


gec 


ggg 


ttc 


acc 


gat 


glu ile 


ser 


gly phe 


ala 


gly phe 


thr 


asp 


301/101 


















tgg cga 


etc 


aga 


gac 


tag 










trp arg 


leu 


arg 


asp 


AMB 











/185 

>3: 537-544) et contenant la sequence Seq 
31/11 

cat ttg ttg tgg ttt egg ttg agg ccg agg 
his leu leu trp phe arg leu arg pro arg 
91/31 

ggt cgc age ate gtt gcg gcg ate gcg gcg 
gly arg ser ile val ala ala ile ala ala 
151/51 

acg ate teg aac teg acg ccc tec tgt teg 
thr ile ser asn ser thr pro ser cys ser 
211/71 

gcg ccg ttg ttg tac ate ggg atg cac acc 
ala pro leu leu tyr ile gly met his thr 
271/91 

acc acg ctt gat gca tea cca ggc acc aca 
thr thr leu asp ala ser pro gly thr thr 



SEQ ID N° 4F 
FIGURE 4F 



sequence en amont de seq4A* 
1/1 

GCA ACC TAC CAG CAG AGC CAG 
ala thr tyr gin gin ser gin 

C 



et en fusion avec seq4A' 
31/11 

GGG CTC ACA GGA CCT AAA 
gly leu tht gly pro lys 



SEQ ID N° 4J 



GGA GTA GCG CCC ATG GCT GAT 
gly val ala pro met ala asp 



FIGURE 4 J 



seq4J' dans une autre phase de lecture 

1/1 31/11 

ACG CAA CCT ACC AGC AGA GCC AGG GGC TCA CAG GAC CTA AAG GAG TAG CGC CCA TGG CTG 

thr gin pro thr ser arg ala arg gly ser gin asp leu lys glu AMB arg pro trp leu 

61/21 

ATC 

ile 

SEQ ID N°4K 
FIGURE 4K 



seq 4J' dans la troisieme phase de lecture 
1/1 31/11 

CGC AAC CTA CCA GCA GAG CCA GGG GCT CAC AGG ACC TAA AGG AGT AGC GCC CAT GGC TGA 
arg asn leu pro ala glu pro gly ala his arg thr OCH arg ser ser ala his gly OPA 

TC 

SEQ ID N° 4L 



FEUILLE DE REMPLA^Mfe^f (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



12/185 



sequence Rv2050 predite par Cole et al. (Nature 393:537-544) et contenant seq4J 
1/1 31/11 





GAT 


CGT 


GTC 




AGG 


GGC 


A (VP 




CTC GGA 


GCC 


bib 


ALL 


I AI 


GAG 


ACC 


GAC 


CGC 


Met ala 


asp 


arg 


val 


leu 


arg gly 


OCX 


al y 


leu gly ala 


val 


ser 


tyr 


glu 


thr 


asp 


arg 


61 /?! 


















Q1 /**1 

31/ Jl 










AAC CAC 


GAC 


CTG 


GCG 


CCG 


CGC 


PZVP 


ATC 


GCG 


HPP mnp 


CGC 




ft tap 

br\L 


a tap 




p 7v p 


(jACj 


TTC 


asn his 


asp 


leu 


ala 


pro 


arg 


gin 


ile 


ala 


arg tyr 


arg 


t-h r 


asp 


asn 


gly 


gj.u 


glu 


phe 


l£ 1/11 


















X <J X / Jl 










caa fZTP 




TTC 


GCC 


GAT 


GAC 


GCC 




ATP 


CCC GGC 


ACC 


1GG 


TTG 


TGC 


CGC 


AAC 


GGC 


ATG 


glu val 


pro 


phe ala 


asp 


asp 


ala 


glu 


ile 


pro gly 


thr 


t* rn 

crp 


leu 


cys 


arg 


asn 


gly 


met 


181/61 


















211/71 












GAA GGC 


ACC 


CTG 


ATC 


GAG 


GGC 


GAC 


CTG 


ccc 


GAG CCG 


AAG 


AAG 


GTT 


AAG 


CCG 


CCC 


CGG 


ACG 


glu gly 


thr 


leu 


ile 


glu gly 


asp 


leu 


pro 


glu pro 


lys 


lys 


val 


lys 


pro 


pro 


arg 


thr 


241/81 


















271/91 














CAC TGG 


GAC 


ATG 


CTG 


CTG 


GAG 


CGC 


CGT 


TCC 


ATC GAA 


GAA 


CTC 


GAA 


GAG 


TTA 


CTT 


AAG 


GAG 


his trp 


asp 


met 


leu 


leu 


glu 


arg 


arg 


ser 


ile glu 


glu 


leu 


glu 


glu 


leu 


leu 


lys 


glu 


301/101 


















331/111 














CGC CTC 


GAG 


CTC 


ATT 


CGG 


TCA 


CGT 


CGG 


CGC 


GGC TGA 


















arg leu 


glu leu 


ile 


arg 


ser 


arg 


arg 


arg 


gly OPA 



















SEQ ID N° 4M 
FIGURE 4M 



ORF d'apres par Cole et al. (Nature 
1/1 

TAG TCC GCC CGG GTG TCC GAT CCC GGT 
AMB ser ala arg val ser asp pro gly 
61/21 

CGG GAA CTA CGC AGA CGG CCG CAG CGT 
arg glu leu arg arg arg pro gin arg 
121/41 

TAC CAG CAG AGC CCA GGG CTC ACA GGA 
tyr gin gin ser pro gly leu thr gly 
181/61 

CTG AGG GGC AGT CGC CTC GGA GCC GTG 
leu arg gly ser arg leu gly ala val 
241/81 

CCG CGC CAG ATC GCG CGG TAC CGC ACC 
pro arg gin ile ala arg tyr arg thr 
301/101 

GAT GAC GCC GAG ATC CCC GGC ACC TGG 
asp asp ala glu ile pro gly thr trp 
361/121 

GAG GGC GAC CTG CCC GAG CCG AAG AAG 
glu gly asp leu pro glu pro lys lys 
421/141 

CTG GAG CGC CGT TCC ATC GAA GAA CTC 
leu glu arg arg ser ile glu glu leu 
481/161 

CGG TCA CGT CGG CGC GGC TGA 
arg ser arg arg arg gly OPA 



393:537-544) et contenant la sequence Rv2050 
* 31/11 

ATC ATT GAT GGT CGC GCC GCG CGC GTC GCG TGC 
ile ile asp gly arg ala ala arg val ala cvs 
91/31 

TTG CCA ACC GGA GCC AGT CGC CAG TAC GCA ACC 
leu pro thr gly ala ser arg gin tyr ala thr 
151/51 

CCT AAA GGA GTA GCG CCC ATG GCT GAT CGT GTC 
pro lys gly val ala pro met ala asp arg val 
211/71 

AGC TAT GAG ACC GAC CGC AAC CAC GAC CTG GCG 
ser tyr glu thr asp arg asn his asp leu ala 
271/91 

GAC AAC GGC GAG GAG TTC GAA GTC CCG TTC GCC 
asp asn gly glu glu phe glu val pro phe ala 
331/111 

TTG TGC CGC AAC GGC ATG GAA GGC ACC CTG ATC 
leu cys arg asn gly met glu gly thr leu ile 
391/131 

GTT AAG CCG CCC CGG ACG CAC TGG GAC ATG CTG 
val lys pro pro arg thr his trp asp met leu 
451/151 

GAA GAG TTA CTT AAG GAG CGC CTC GAG CTC ATT 
glu glu leu leu lys glu arg leu glu leu ile 



SEQ ID N° 4N 
FEUILLE DE REMPlfA^ENJ (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



13/185 



GAT CGC GGT CAA CGA 
asp arg gly gin arg 
61/21 

TGG CTA CGC CGC GGC 
trp leu arg arg gly 
121/41 

GGA GAT GAC CAG CGC 
gly asp asp gin arg 
181/61 

CAC CGC CGC GGC GAA 
his arg arg gly glu 
241/81 

GCC CAC GCA GGG CAC 
ala his ala gly his 
301/101 

GCA TCG GTC GCC GAT 
ala ser val ala asp 



GGC CGA ATA CGG CGA 
gly arg ile arg arg 

GAC GGC GAC GGC GAC 
asp gly asp gly asp 

GGG TGG GCT CCT CGA 
gly trp ala pro arg 

CCA GTT GAT GAA CAA 
pro val asp glu gin 

CAC GCC TTC TTC CAA 
his ala phe phe gin 

C 



31/11 

GAT GTG GGC CCA AGA 
asp val gly pro arg 
91/31 

GGC GAC GTT GCT GCC 
gly asp val ala ala 
151/51 

GCA GGC CGC CGC GGT 
ala gly arg arg gly 
211/71 

TGT GCC CCA GGC GCT 
cys ala pro gly ala 
271/91 

GCT GGG TGG CCT GTG 
ala gly trp pro val 



CGC CGC CGC GAT GTT 
arg arg arg asp val 

GTT CGA GGA GGC GCC 
val arg gly gly ala 

CGA GGA GGC CTC CGA 
arg gly gly leu arg 

GCA ACA GCT GGC CCA 
ala thr ala gly pro 

GAA GAC GGT CTC GCC 
glu asp gly leu ala 



SEQ ID N° 5A 
FIGURE 5A 



ATC GCG GTC AAC 
ile ala val asn 
62/21 

GGC TAC GCC GCG 
gly tyr ala ala 
122/41 

GAG ATG ACC AGC 
glu met thr ser 
182/61 

ACC GCC GCG GCG 
thr ala ala ala 
242/81 

CCC ACG CAG GGC 
pro thr gin gly 
302/101 

CAT CGG TCG CCG 
his arg ser pro 



GAG GCC GAA TAC 
glu ala glu tyr 

GCG ACG GCG ACG 
ala thr ala thr 

GCG GGT GGG CTC 
ala gly gly leu 

AAC CAG TTG ATG 
asn gin leu met 

ACC ACG CCT TCT 
thr thr pro ser 

ATC 
ile 







32/11 


GGC 


GAG 


ATG TGG 


gly 


glu 


met trp 






92/31 


GCG 


ACG 


GCG ACG 


ala 


thr 


ala thr 






152/51 


CTC 


GAG 


CAG GCC 


leu 


glu 


gin ala 






212/71 


AAC 


AAT 


GTG CCC 


asn 


asn 


val pro 






272/91 


TCC 


AAG 


CTG GGT 


ser 


lys 


leu gly 



GCC CAA GAC GCC 
ala gin asp ala 

TTG CTG CCG TTC 
leu leu pro phe 

GCC GCG GTC GAG 
ala ala val glu 

CAG GCG CTG CAA 
gin ala leu gin 

GGC CTG TGG AAG 
gly leu trp lys 



GCC GCG ATG TTT 
ala ala met phe 

GAG GAG GCG CCG 
glu glu ala pro 

GAG GCC TCC GAC 
glu ala ser asp 

CAG CTG GCC CAG 
gin leu ala gin 

ACG GTC TCG CCG 
thr val ser pro 



SEQ ID N° 5B 



FIGURE 5B 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



14/185 



33/11 



TCG CGG 


TCA 


ACG 


AGG 


CCG 


AAT 


ACG 


GCG 


AGA 


TGT GGG 


CCC 


AAG 


ACG 


CCG 


CCG 


CGA 


TGT 


TTG 


ser arg 
63/21 


ser 


thr 


arg 


pro 


asn 


thr 


ala 


arg 


cys gly 
93/31 


pro lys 


thr 


pro 


pro 


arg 


cys 


leu 


GCT ACG 


CCG 


CGG 


CGA 


CGG 


CGA 


CGG 


CGA 


CGG 


CGA CGT 


TGC 


TGC 


CGT 


TCG 


AGG 


AGG 


CGC 


CGG 


ala thr 
123/41 


pro 


arg 


arg 


arg 


arg 


arg 


arg 


arg 


arg arg 
153/51 


cys 


cys 


arg 


ser 


arg 


arg 


arg 


arg 


AGA TGA 


CCA 


GCG 


CGG 


GTG 


GGC 


TCC 


TCG 


AGC 


AGG CCG 


CCG 


CGG 


TCG 


AGG 


AGG 


CCT 


CCG 


ACA 


arg OPA 
183/61 


pro 


ala 


arg 


val 


gly 


ser 


ser 


ser 


arg pro 
213/71 


pro 


arg 


ser 


arg 


ara 


Dro 


pro 


thr 


CCG CCG 


CGG 


CGA 


ACC 


AGT 


TGA 


TGA 


ACA 


ATG 


TGC CCC 


AGG 


CGC 


TGC 


AAC 


AGC 


TGG 


CCC 


AGC 


pro pro 
243/81 


arg 


arg 


thr 


ser 


OPA 


OPA 


thr 


met 


cys pro 
273/91 


arg 


arg 


cys 


asn 


ser 


trp 


pro 


ser 


CCA CGC 


AGG 


GCA 


CCA 


CGC 


CTT 


CTT 


CCA 


AGC 


TGG GTG 


GCC 


TGT 


GGA 


AGA 


CGG 


TCT 


CGC 


CGC 


pro arg 
303/101 


arg 


ala 


pro 


arg 


leu 


leu 


pro 


ser 


trp val 


ala 


cys 


gly 


arg 


arg 


ser 


arg 


arg 


ATC GGT 


CGC 


CGA 


TC 






























ile gly 


arg 


arg 

































SEQ ID N° 5C 
FIGURE 5C 



partie de la sequence nucl6otidique Seq 5A 



1/1 


















31/11 


















CGC CGC 


GGC 


GAC 


GGC 


GAC 


GGC 


GAC 


GGC 


GAC 


GTT GCT 


GCC 


GTT 


CGA 


GGA 


GGC 


GCC 


GGA 


GAT 


arg arg 
61/21 


gly 


asp 


gly 


asp 


gly 


asp 


gly 


asp 


val ala 
91/31 


ala 


val 


arg 


gly 


gly 


ala 


gly 


asp 


GAC CAG 


CGC 


GGG 


TGG 


GCT 


CCT 


CGA 


GCA 


GGC 


CGC CGC 


GGT 


CGA 


GGA 


GGC 


CTC 


CGA 


CAC 


CGC 


asp gin 
121/41 


arg 


gly trp 


ala 


pro 


arg 


ala 


gly 


arg arg gly arg 
151/51 


gly 


gly 


leu 


arg 


his 


arg 


CGC GGC 


GAA 


CCA 


GTT 


GAT 


GAA 


CAA 


TGT 


GCC 


CCA GGC 


GCT 


GCA 


ACA 


GCT 


GGC 


CCA 


GCC 


CAC 


arg gly 
181/61 


glu 


pro 


val 


asp 


glu 


gin 


cys 


ala 


pro gly 
271/71 


ala 


ala 


thr 


ala 


gly 


pro 


ala 


his 


GCA GGG 


CAC 


CAC 


GCC 


TTC 


TTC 


CAA 


GCT 


GGG 


TGG CCT 


GTG 


GAA 


GAC 


GGT 


CTC 


GCC 


GCA 


TCG 


ala gly 


his 


his 


ala 


phe 


phe 


gin 


ala 


gly 


trp pro 


val 


glu 


asp 


gly 


leu 


ala 


ala 


ser 



241/81 

GTC GCC GAT C 
val ala asp 



SEQ ID N° 5A f 
FIGURE 5A' 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT7FR98/01813 



15/185 



1/1 

TAC GCC GCG GCG ACG GCG ACG 
tyr ala ala ala thr ala thr 
61/21 

ATG ACC AGC GCG GGT GGG CTC 
met thr ser ala gly gly leu 
121/41 

GCC GCG GCG AAC CAG TTG ATG 
ala ala ala asn gin leu met 
181/61 

ACG CAG GGC ACC ACG CCT TCT 
thr gin gly thr thr pro ser 
241/81 

CGG TCG CCG ATC 
arg ser pro ile 



31/11 

GCG ACG GCG ACG TTG CTG 
ala thr ala thr leu leu 
91/31 

CTC GAG CAG GCC GCC GCG 
leu glu gin ala ala ala 
151/51 

AAC AAT GTG CCC CAG GCG 
asn asn val pro gin ala 

211/71 
TCC AAG CTG GGT GGC CTG 
ser lys leu gly gly leu 



SEQ ID N° SB 1 
FIGURE 5B' 



CCG TTC GAG GAG GCG CCG GAG 
pro phe glu glu ala pro glu 

GTC GAG GAG GCC TCC GAC ACC 
val glu glu ala ser asp thr 

CTG CAA CAG CTG GCC CAG CCC 
leu gin gin leu ala gin pro 

TGG AAG ACG GTC TCG CCG CAT 
trp lys thr val ser pro his 



1/1 

ACG CCG CGG CGA CGG CGA CGG CGA CGG CGA 
thr pro arg arg arg arg arg arg arg arg 
61/21 

TGA CCA GCG CGG GTG GGC TCC TCG AGC AGG 
OPA pro ala arg val gly ser ser ser arg 
121/41 

CCG CGG CGA ACC AGT TGA TGA ACA ATG TGC 
pro arg arg thr ser OPA OPA thr met cys 
181/61 

CGC AGG GCA CCA CGC CTT CTT CCA AGC TGG 
arg arg ala pro arg leu leu pro ser trp 
241/81 

GGT CGC CGA TC 
gly arg arg 



31/11 

CGT TGC TGC CGT TCG AGG AGG CGC CGG AGA 
arg cys cys arg ser arg arg arg arg arg 
91/31 

CCG CCG CGG TCG AGG AGG CCT CCG ACA CCG 
pro pro arg ser arg arg pro pro thr pro 
151/51 

CCC AGG CGC TGC AAC AGC TGG CCC AGC CCA 
pro arg arg cys asn ser trp pro ser pro 
211/71 

GTG GCC TGT GGA AGA CGG TCT CGC CGC ATC 
val ala cys gly arg arg ser arg arg ile 



SEQ ID N° 5C» 
FIGURE 5C f 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



16/185 



ORF predite par Cole et al. 
1/1 

tga act gat gat tct gat age 
OPA thr asp asp ser asp ser 
61/21 

caa cga ggc cga ata egg cga 
gin arg gly arg ile arg arg 
121/41 

cgc ggc gac ggc gac ggc gac 
arg gly asp gly asp gly asp 
181/61 

cag cgc ggg tgg get cct cga 
gin arg gly trp ala pro arg 
241/81 

ggc gaa cca gtt gat gaa caa 
gly glu pro val asp glu gin 
301/101 

ggg cac cac gec ttc ttc caa 
gly his his ala phe phe gin 
361/121 

gec gat cag caa cat ggt gtc 
ala asp gin gin his gly val 
421/141 

gtc gat gac caa cac ctt gag 
val asp asp gin his leu glu 
481/161 

ggc cgt gca aac cgc ggc gca 
gly arg ala asn arg gly ala 
541/181 

ggg ttc ttc ggg tct ggg egg 
gly phe phe gly ser gly arg 
601/201 

ttc gtt gtc ggt gec gca ggc 
phe val val gly ala ala gly 
661/221 

ggc get gec get gac cag cct 
gly ala ala ala asp gin pro 
721/241 

egg get gee ggt ggg gca gat 
arg ala ala gly gly ala asp 
781/261 

tgt tec gee gcg ace eta tgt 
cys ser ala ala thr leu cys 
841/281 

cag act gtc gtt att tga 
gin thr val val ile OPA 



(Nature 393:537-544) et 
31/11 

gac caa cct ctt ggg gca 
asp gin pro leu gly ala 
91/31 

gat gtg ggc cca aga cgc 
asp val gly pro arg arg 
151/51 

ggc gac gtt get gec gtt 
gly asp val ala ala val 
211/71 

gca ggc cgc cgc ggt cga 
ala gly arg arg gly arg 

271/91 
tgt gee cca ggc get gca 
cys ala pro gly ala ala 

331/111 
get ggg tgg cct gtg gaa 
ala gly trp pro val glu 

391/131 
gat ggc caa caa cca cat 
asp gly gin gin pro his 

451/151 
etc gat gtt gaa ggg ctt 
leu asp val glu gly leu 

511/171 
aaa egg ggt ccg ggc gat 
lys arg gly pro gly asD 

571/191 
tgg ggt ggc cgc caa ctt 
trp gly gly arg gin leu 

631/211 
ctg ggc cgc ggc caa cca 
leu gly arg gly gin pro 

691/231 
gac cag cgc cgc gga aag 
asp gin arg arg gly lys 

751/251 
ggg cgc cag ggc egg tgg 
gly arg gin gly arg trp 

811/271 
gat gee gca ttc tec ggc 
asp ala ala phe ser gly 



contenant seqSA' 

aaa cac ccc ggc gat cgc ggt 
lys his pro gly asp arg gly 

cgc cgc gat gtt tgg eta cgc 
arg arg asp val trp leu arg 

cga gga ggc gec gga gat gac 
arg gly gly ala gly asp asp 

gga ggc etc cga cac cgc cgc 
gly gly leu arg his arg arg 

aca get ggc cca gee cac gca 
thr ala gly pro ala his ala 

gac ggt etc gee gca teg gtc 
asp gly leu ala ala ser val 

gtc gat gac caa etc ggg tgt 
val asp asp gin leu gly cys 

tgc tec ggc ggc ggc cgc cca 
cys ser gly gly gly arg pro 

gag etc get ggg cag etc get 
glu leu ala gly gin leu ala 

ggg teg ggc ggc etc ggt egg 
gly ser gly gly leu gly arg 

ggc agt cac ccc ggc ggc gcg 
gly ser his pro gly gly ala 

agg gec egg gca gat get ggg 
arg ala arg ala asp ala gly 

tgg get cag tgg tgt get gcg 
trp ala gin trp cys ala ala 

ggc egg eta gga gag ggg gcg 
gly arg leu gly glu gly ala 



SEQ ID N° 5F 



FIGURE 5F 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT7FR98/01813 



17/185 



sequence Rvll96 predite par Cole et al. 

ORF en fusion avec SeqSA' 

1/1 

atg gtg gat ttc ggg gcg tta cca ccg gag 
Met val asp phe gly ala leu pro pro glu 
61/21 

ggt teg gec teg ctg gtg gec gcg get cag 
gly ser ala ser leu val ala ala ala gin 
121/41 

teg gec gcg teg gcg ttt cag teg gtg gtc 
ser ala ala ser ala phe gin ser val val 
181/61 

teg teg gcg ggt ctg atg gtg gcg gcg gec 

ser ser ala gly leu met val ala 

ala ala ser pro tyr val ala trp met ser 

241/81 

gcg ggg cag gec gag ctg acc gec gee cag 
ala gly gin ala glu leu thr ala ala gin 
301/101 

gcg tat ggg ctg acg gtg ccc ccg ccg gtg 
ala tyr gly leu thr val pro pro pro val 
361/121 

ctg ata gcg acc aac etc ttg ggg caa aac 
leu ile ala thr asn leu leu gly gin asn 
421/141 

tac ggc gag atg tgg gec caa gac gee gec 
tyr gly glu met trp ala gin asp ala ala 
481/161 

acg gcg acg gcg acg ttg ctg ccg ttc gag 
thr ala thr ala thr leu leu pro phe glu 
541/181 

etc etc gag cag gee gee gcg gtc gag gag 
leu leu glu gin ala ala ala val glu glu 
601/201 

atg aac aat gtg ccc cag gcg ctg caa cag 
met asn asn val pro gin ala leu gin gin 
661/221 

tct tec aag ctg ggt ggc ctg tgg aag acg 
ser ser lys leu gly gly leu trp lys thr 
721/241 

atg gtg teg atg gee aac aac cac atg teg 
met val ser met ala asn asn his met ser 
781/261 

acc ttg age teg atg ttg aag ggc ttt get 
thr leu ser ser met leu lys gly phe ala 
841/281 

gcg gcg caa aac ggg gtc egg gcg atg age 
ala ala gin asn gly val arg ala met ser 
901/301 

ctg ggc ggt ggg gtg gee gee aac ttg ggt 
leu gly gly gly val ala ala asn leu gly 
961/321 

ccg cag gee tgg gec gcg gee aac cag gca 
pro gin ala trp ala ala ala asn gin ala 
1021/341 

acc age ctg acc age gee gcg gaa aga ggg 
thr ser leu thr ser ala ala glu arg gly 
1081/361 

ggg cag atg ggc gee agg gee ggt ggt ggg 
gly gin met gly ala arg ala gly gly gly 
1141/381 

ccc tat gtg atg ccg cat tct ccg gcg gec 
pro tyr val met pro his ser pro ala ala 



(Nature 393:537-544) et pouvant coder pour 
31/11 

ate aac tec gcg agg atg tac gee ggc ccg 
ile asn ser ala arg met tyr ala gly pro 
91/31 

atg tgg gac age gtg gcg agt gac ctg ttt 
met trp asp ser val ala ser asp leu phe 
151/51 

tgg ggt ctg acg gtg ggg teg tgg ata ggt 
trp gly leu thr val gly ser trp ile gly 
211/71 

teg ccg tat gtg gcg tgg atg age gtc acc 

val thr 
271/91 

gtc egg gtt get gcg gcg gec tac gag acg 
val arg val ala ala ala ala tyr glu thr 
331/111 

ate gee gag aac cgt get gaa ctg atg att 
ile ala glu asn arg ala glu leu met ile 
391/131 

acc ccg gcg ate gcg gtc aac gag gee gaa 
thr pro ala ile ala val asn glu ala glu 
451/151 

gcg atg ttt ggc tac gee gcg gcg acg gcg 
ala met phe gly tyr ala ala ala thr ala 
511/171 

gag gcg ccg gag atg acc age gcg ggt ggg 
glu ala pro glu met thr ser ala gly gly 
571/191 

gee tec gac acc gec gcg gcg aac cag ttg 
ala ser asp thr ala ala ala asn gin leu 
631/211 

ctg gec cag ccc acg cag ggc acc acg cct 
leu ala gin pro thr gin gly thr thr pro 
691/231 

gtc teg ccg cat egg teg ccg ate age aac 
val ser pro his arg ser pro ile ser asn 
751/251 

atg acc aac teg ggt gtg teg atg acc aac 
met thr asn ser gly val ser met thr asn 
811/271 

ccg gcg gcg gee gee cag gee gtg caa acc 
pro ala ala ala ala gin ala val gin thr 
871/291 

teg ctg ggc age teg ctg ggt tct teg ggt 
ser leu gly ser ser leu gly ser ser gly 
931/311 

egg gcg gec teg gtc ggt teg ttg teg gtg 
arg ala ala ser val gly ser leu ser val 
991/331 

gtc acc ccg gcg gcg egg gcg ctg ccg ctg 
val thr pro ala ala arg ala leu pro leu 
1051/351 

ccc ggg cag atg ctg ggc ggg ctg ccg gtg 
pro gly gin met leu gly gly leu pro val 
1111/371 

etc agt ggt gtg ctg cgt gtt ccg ccg cga 
leu ser gly val leu arg val pro pro arg 
1171/391 
ggc tag 
gly AM3 



SEQ ID N° 5R 



FIGURE 5R 
FEUILLE DE REM PLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



18/185 



Seq SP: ORF d'apres Cole et 
1/1 

tag gga cac gta atg gtg gat 
AMB gly his val met val asp 
61/21 

tac gcc ggc ccg ggt teg gec 
tyr ala gly pro gly ser ala 
121/41 

agt gac ctg ttt teg gcc gcg 
ser asp leu phe ser ala ala 
181/61 

teg tgg ata ggt teg teg gcg 
ser trp ile gly ser ser ala 
241/81 

atg age gtc ace gcg ggg cag 
met ser val thr ala gly gin 
301/101 

gcc tac gag acg gcg tat ggg 
ala tyr glu thr ala tyr gly 
361/121 

gaa ctg atg att ctg ata gcg 
glu leu met ile leu ile ala 
421/141 

aac gag gcc gaa tac ggc gag 
asn glu ala glu tyr gly glu 
481/161 

gcg gcg acg gcg acg gcg acg 
ala ala thr ala thr ala thr 
541/181 

age gcg ggt ggg etc etc gag 
ser ala gly gly leu leu glu 
601/201 

gcg aac cag ttg atg aac aat 
ala asn gin leu met asn asn 
661/221 

ggc acc acg cct tct tec aag 
gly thr thr pro ser ser lys 
721/241 

ccg ate age aac atg gtg teg 
pro ile ser asn met val ser 
781/261 

teg atg acc aac acc ttg age 
ser met thr asn thr leu ser 
841/281 

gcc gtg caa acc gcg gcg caa 
ala val gin thr ala ala gin 
901/301 

ggt tct teg ggt ctg ggc ggt 
gly ser ser gly leu gly gly 
961/321 

teg ttg teg gtg ccg cag gcc 
ser leu ser val pro gin ala 
1021/341 

gcg ctg ccg ctg acc age ctg 
ala leu pro leu thr ser leu 
1081/361 1111/371 
ggg ctg ccg gtg ggg cag atg 
gly leu pro val gly gin met 
1141/381 

gtt ccg ccg cga ccc tat gtg 
val pro pro arg pro tyr val 



al. (Nature 393:537-544) et 
31/11 

ttc ggg gcg tta cca ccg gag 
phe gly ala leu pro pro glu 
91/31 

teg ctg gtg gcc gcg get cag 
ser leu val ala ala ala gin 
151/51 

teg gcg ttt cag teg gtg gtc 
ser ala phe gin ser val val 
211/71 

ggt ctg atg gtg gcg gcg gcc 
gly leu met val ala ala ala 
271/91 

gcc gag ctg acc gcc gcc cag 
ala glu leu thr ala ala gin 

331/111 
ctg acg gtg ccc ccg ccg gtg 
leu thr val pro pro pro val 
391/131 

acc aac etc ttg ggg caa aac 
thr asn leu leu gly gin asn 
451/151 

atg tgg gcc caa gac gcc gcc 
met trp ala gin asp ala ala 
511/171 

gcg acg ttg ctg ccg ttc gag 
ala thr leu leu pro phe glu 

571/191 
cag gcc gcc gcg gtc gag gag 
gin ala ala ala val glu glu 
631/211 

gtg ccc cag gcg ctg caa cag 
val pro gin ala leu gin gin 
691/231 

ctg ggt ggc ctg tgg aag acg 
leu gly gly leu trp lys thr 

751/251 
atg gcc aac aac cac atg teg 
met ala asn asn his met ser 
811/271 

teg atg ttg aag ggc ttt get 
ser met leu lys gly phe ala 
871/291 

aac ggg gtc egg gcg atg age 
asn gly val arg ala met ser 
931/311 

ggg gtg gcc gcc aac ttg ggt 
gly val ala ala asn leu gly 
991/331 

tgg gcc gcg gcc aac cag gca 
trp ala ala ala asn gin ala 

1051/351 
acc age gcc gcg gaa aga ggg 
thr ser ala ala glu arg gly 

ggc gcc agg gcc ggt ggt ggg 
gly ala arg ala gly gly gly 

1171/391 
atg ccg cat tct ccg gcg gcc 
met pro his ser pro ala ala 



contenant la sequence Rvll96 



ate aac tec gcg agg atg 
ile asn ser ala arg met 

atg tgg gac age gtg gcg 
met trp asp ser val ala 

tgg ggt ctg acg gtg ggg 
trp gly leu thr val gly 

teg ccg tat gtg gcg tgg 
ser pro tyr val ala trp 

gtc egg gtt get gcg gcg 
val arg val ala ala ala 

ate gcc gag aac cgt get 
ile ala glu asn arg ala 

acc ccg gcg ate gcg gtc 
thr pro ala ile ala val 

gcg atg ttt ggc tac gcc 
ala met phe gly tyr ala 

gag gcg ccg gag atg acc 
glu ala pro glu met thr 

gcc tec gac acc gcc gcg 
ala ser asp thr ala ala 

ctg gcc cag ccc acg cag 
leu ala gin pro thr gin 

gtc teg ccg cat egg teg 
val ser pro his arg ser 

atg acc aac teg ggt gtg 
met thr a3n ser gly val 

ccg gcg gcg gcc gcc cag 
pro ala ala ala ala gin 

teg ctg ggc age teg ctg 
ser leu gly ser ser leu 

egg gcg gcc teg gtc ggt 
arg ala ala ser val gly 

gtc acc ccg gcg gcg egg 
val thr pro ala ala arg 

ccc ggg cag atg ctg ggc 
pro gly gin met leu gly 

etc agt ggt gtg ctg cgt 
leu ser gly val leu arg 

ggc tag 
gly AMB 



SEQ ID N° 5P 



FEUILLE DE REM^^S^E^I? (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



19/185 



GGA TCC TGA TGC AAG TGG TCC 
gly ser OPA cys lys trp ser 
61/21 

TTG GTG CAT CCG GGC TGC GAG 
leu val his pro gly cys glu 
121/41 

CTT GCC CAC TGT TCC TCC CTG 
leu ala his cys ser ser leu 
181/61 

GCG GTG CCT GGG CAT CCA GCA 
ala val pro gly his pro ala 
241/81 

TCA CCA ACG TCG AAA CCG ACG 
ser pro thr ser lys pro thr 
301/101 

GCT GTA CCC TCA CCG AAC GTG 
ala val pro ser pro asn val 
361/121 

GCA GCC GAG CTC AAG GTG TCC 
ala ala glu leu lys val ser 
421/141 

GAA GGA GAA GAT C 
glu gly glu asp 









^1/11 

JX/ 11 




GGG 


ATT 


TGT 


CGG CAG 


CPA 


giy 


X X c 




a v n /tin 
aX\£ <jlll 


pro 












CAT 




PGP 


APC GAP 


cam 


Hie 


A 1 a 

aid 


arg 


thr asp 


gin 












CCG 


GCA 


CCA 


TGT GPG 


APA 




al a 

ala 




r*\fo ala 


tnr 








211/71 

611/ IX 




AAA 


CGG 


GGA 


GCT CAA 


GAA 


1 us 


a m 


gj.y 


ala rr 1 n 
a xa \jxil 


glu 








971 /Q1 

£- IX/ J X 




GTT 


GCC 


AGC 


CGG PPP 


APG 


val 


ala 


ser 


arg pro 


thr 








331/111 




AGT 


CCC 


ACA 


CCG CGG 


AGG 


ser 


pro 


thr 


pro arg 


arg 








391/131 




CGC 


ACC 


ACT 


GTC TCG 


AAT 


arg 


thr 


thr 


val ser 


asn 



CCG CGG TCC CGT CGA CCA ACG 
arg arg ser arg arg pro thr 

CGC GGC GAG CGC GGC TAG CTG 
arg gly glu arg gly AMB leu 

AGC TTA AGC GCA GCA GTA CCG 
ser leu ser ala ala val pro 

CGA TTC ATG AAC GAG GGG TCG 
arg phe met asn glu gly sec 

ATA TTG CGT GCT CGA GGG TCC 
ile leu arg ala arg gly ser 

CGG GCG ACT CTG GCG TCG TTA 
arg ala thr leu ala ser leu 

GCT TTT AAC CGA CCG GAT CCA 
ala phe asn arg pro asp pro 



SEQ ID N° 6A 



FIGURE 6A 



GAT CCT GAT GCA AGT GGT CCG GGA TTT GTC 
asp pro asp ala ser gly pro gly phe val 
62/21 

TGG TGC ATC CGG GCT GCG AGC ATG CAC GCA 
trp cys ile arg ala ala ser met his ala 
122/41 

TTG CCC ACT GTT CCT CCC TGC CGG CAC CAT 
leu pro thr val pro pro cys arg his his 
182/61 

CGG TGC CTG GGC ATC CAG CAA AAC GGG GAG 
arg cys leu gly ile gin gin asn gly glu 
242/81 

CAC CAA CGT CGA ,AAC CGA CGG TTG CCA GCC 
his gin arg arg asn arg arg leu pro ala 
302/101 

CTG TAC CCT CAC CGA ACG TGA GTC CCA CAC 
leu tyr pro his arg thr OPA val pro his 
362/121 

CAG CCG AGC TCA AGG TGT CCC GCA CCA CTG 
gin pro ser ser arg cys pro ala pro leu 
422/141 

AAG GAG AAG ATC 
lys glu lys ile 



32/11 

GGC AGC CAC GGC GGT CCC GTC GAC CAA CGT 
gly ser his gly gly pro val asp gin arg 
92/31 

CCG ACC AGC GCG GCG AGC GCG GCT AGC TGC 
pro thr ser ala ala ser ala ala ser cys 
152/51 

GTG CGA CAA GCT TAA GCG CAG CAG TAC CGG 
val arg gin ala OCH ala gin gin tyr arg 
212/71 

CTC AAG AAC GAT TCA TGA ACG AGG GGT CGT 
leu lys asn asp ser OPA thr arg gly arg 
272/91 

GGC CCA CGA TAT TGC GTG CTC GAG GGT CCG 
gly pro arg tyr cys val leu glu gly oro 
332/111 

CGC GGA GGC GGG CGA CTC TGG CGT CGT TAG 
arg gly gly gly arg leu trp arg arg AM 3 
392/131 

TCT CGA ATG CTT TTA ACC GAC CGG ATC CAG 
ser arg met leu leu thr asp arg ile gin 



SEQ ID N° 6B 
FEUILLE DE REMpUSSfefff (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



20/185 



ATC CTG ATG CAA GTG GTC CGG GAT TTG TCG 
ile leu met gin val val arg asp leu ser 
63/21 

GGT GCA TCC GGG CTG CGA GCA TGC ACG CAC 
gly ala ser gly leu arg ala cys thr his 
123/41 

TGC CCA CTG TTC CTC CCT GCC GGC ACC ATG 
cys pro leu phe leu pro ala gly thr met 
183/61 

GGT GCC TGG GCA TCC AGC AAA ACG GGG AGC 
gly ala trp ala ser ser lys thr gly ser 
243/81 

ACC AAC GTC GAA ACC GAC GGT TGC CAG CCG 
thr asn val glu thr asp gly cys gin pro 
303/101 

TGT ACC CTC ACC GAA CGT GAG TCC CAC ACC 
cys thr leu thr glu arg glu ser his thr 
363/121 

AGC CGA GCT CAA GGT GTC CCG CAC CAC TGT 
ser arg ala gin gly val pro his his cys 
423/141 

AGG AGA AGA TC 
arg arg arg 



33/11 

GCA GCC ACG GCG GTC CCG TCG ACC AAC GTT 
ala ala thr ala val pro ser thr asn val 
93/31 

CGA CCA GCG CGG CGA GCG CGG CTA GCT GCT 
arg pro ala arg arg ala arg leu ala ala 
153/51 

TGC GAC AAG CTT AAG CGC AGC AGT ACC GGC 
cys asp lys leu lys arg scr ser thr gly 
213/71 

TCA AGA ACG ATT CAT GAA CGA GGG GTC GTC 
ser arg thr ile his glu arg gly val val 
273/91 

GCC CAC GAT ATT GCG TGC TCG AGG GTC CGC 
ala his asp ile ala cys ser arg val arg 
333/111 

GCG GAG GCG GGC GAC TCT GGC GTC GTT AGC 
ala glu ala gly asp ser gly val val ser 
393/131 

CTC GAA TGC TTT TAA CCG ACC GGA TCC AGA 
leu glu cys phe OCH pro thr gly ser arg 



SEQ ID N° 6C 
FIGURE 6C 



CCG TCG GCA ACT TGG 
pro ser ala thr trp 
61/21 

AGC GGC TCC ATC GGC 
ser gly ser ile gly 
121/41 

TGG CCG GTG ATA TAT 
trp pro val ile tyr 
181/61 

CGC CGC GGT GCT CGA 
arg arg gly ala arg 
241/81 

CTT GTA TCT CTT CTC 
leu val ser leu leu 
301/101 

AGG TTC ACC AGG TCT 
arg phe thr arg ser 



CCG CTG AGG TCG GCT 
pro leu arg ser ala 

TTT GCT GGT AGC GGT 
phe ala gly ser gly 

TCG GTC AGA CGG GTA 
trp val arg arg val 

GCC AGG CTT ACG ACC 
ala arg leu thr thr 

CGT GCC ACC CCC TAG 
arg ala thr pro AMB 

CAC CAG ATC 
his gin ile 



31/11 

TGA TCC CTG GGC CGA 
OPA ser leu gly arg 
91/31 

TCG GCG GGA AGC TAG 
ser ala gly ser AMB 
151/51 

TGG CGG CGG CTG AGG 
trp arg arg leu arg 
211/71 

AGG GAA TTT CGA AAA 
arg glu phe arg lys 
271/91 

GTG TAG TGT TTT CGA 
val AMB cys phe arg 



GGC GGG TCA GCC AAT 
gly gly ser ala asn 

CGG CGA CGT TGT CGG 
arg arg arg cys arg 

TGA TCT GCG ACA CGC 
OPA ser ala thr arg 

TGT TAT TCA GAA CAT 
cys tyr ser glu his 

GTA CCG GCA GAT CCC 
val pro ala asp pro 



SEQ ID N° 7A 



FIGURE 7A 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



21/185 



CGT CGG CAA CTT 
arg arg gin leu 
62/21 

GCG GCT CCA TCG 
ala ala pro ser 
122/41 

GGC CGG TGA TAT 
gly arg OPA tyr 
182/61 

GCC GCG GTG CTC 
ala ala val leu 
242/81 

TTG TAT CTC TTC 
leu tyr leu phe 
302/101 

GGT TCA CCA GGT 
gly ser pro gly 



GGC CGC TGA GGT 
gly arg OPA gly 

GCT TTG CTG GTA 
ala leu leu val 

ATT GGG TCA GAC 
ile gly ser asp 

GAG CCA GGC TTA 
glu pro gly leu 

TCC GTG CCA CCC 
ser val pro pro 

CTC ACC AGA TC 
leu thr arg 



32/11 
CGG CTT GAT CCC 
arg leu asp pro 

92/31 
GCG GTT CGG CGG 
ala val arg arg 

152/51 
GGG TAT GGC GGC 
gly tyr gly gly 

212/71 
CGA CCA GGG AAT 
arg pro gly asn 

272/91 
CCT AGG TGT AGT 
pro arg cys ser 



SEQ ID N° 7B 
FIGURE 7B 



TGG GCC GAG GCG 
trp ala glu ala 

GAA GCT AGC GGC 
glu ala ser gly 

GGC TGA GGT GAT 
gly OPA gly asp 

TTC GAA AAT GTT 
phe glu asn val 

GTT TTC GAG TAC 
val phe glu tyr 



GGT CAG CCA ATA 
gly gin pro ile 

GAC GTT GTC GGT 
asp val val gly 

CTG CGA CAC GCC 
leu arg his ala 

ATT CAG AAC ATC 
ile gin asn ile 

CGG CAG ATC CCA 
arg gin ile pro 



GTC GGC AAC TTG GCC GCT GAG 
val gly asn leu ala ala glu 
63/21 

CGG CTC CAT CGG CTT TGC TGG 
arg leu his arg leu cys trp 
123/41 

GCC GGT GAT ATA TTG GGT CAG 
ala gly asp ile leu gly gin 
183/61 

CCG CGG TGC TCG AGC CAG GCT 
pro arg cys ser ser gin ala 
243/81 

TGT ATC TCT TCT CCG TGC CAC 
cys ile ser ser pro cys his 
303/101 

GTT CAC CAG GTC TCA CCA GAT 
val his gin val ser pro asp 









33/11 




GTC 


GGC 


TTG 


ATC CCT 


GGG 


val 


gly 


leu 


ile pro 


gly 








93/31 




TAG 


CGG 


TTC 


GGC GGG 


AAG 


AMB 


arg 


phe 


gly gly lys 








153/51 




ACG 


GGT 


ATG 


GCG GCG 


GCT 


thr 


gly 


met 


ala ala 


ala 








213/71 




TAC 


GAC 


CAG 


GGA ATT 


TCG 


tyr 


asp 


gin 


gly ile 


ser 








273/91 




CCC 


CTA 


GGT 


GTA GTG 


TTT 


pro 


leu 


gly 


val val 


phe 



C 



SEQ ID N° 7C 
FIGURE 7C 



CCG AGG CGG GTC AGC CAA TAG 
pro arq arg val ser gin AMB 

CTA GCG GCG ACG TTG TCG GTG 
leu ala ala thr leu ser val 

GAG GTG ATC TGC GAC ACG CCG 
glu val ile cys asp thr pro 

AAA ATG TTA TTC AGA ACA TCT 
lys met leu phe arg thr ser 

TCG AGT ACC GGC AGA TCC CAG 
ser ser thr gly arg ser gin 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



22/185 



CTT TGC GTG ATG TCC AAT GGC GAA AAC GAC 
leu cys val met ser asn gly glu asn asp 
61/21 

TAG TTT TCG CGA TGA CGC TCG TTC TGA CCG 
AMB phe ser arg OPA arg ser phe OPA pro 
121/41 

AGC GAA CCG TCG ATT CCA TGG GTG TCG ACG 
ser glu pro ser ile pro trp val ser thr 
181/61 

CGT TCC TGG GTT CGA CAC CAT TCG CCC AAA 
arg ser trp val arg his his ser pro lys 
241/81 

GCG TCT TGG CTG CCG CCC CAC TAG CGA CTG 
ala ser trp leu pro pro his AMB arg leu 
301/101 

CGC GAA ACG TCA CCG CGT TCG GGG CAC CAG 
arg glu thr ser pro arg ser gly his gin 
361/121 

ACG GTC GGG CGC CAT CGA CGC CGG ACG AGG 
thr val gly arg his arg arg arg thr arg 
421/141 

TCG GCG ACG ATC 
ser ala thr ile 



31/11 

GCC TTG TCA TCG CAA TCG TCA GCA CCG GCC 
ala leu ser ser gin ser ser ala pro ala 
91/31 

GAC TTG TGA ACG GGT TTC GGG TCG AGG CCG 
asp leu OPA thr gly phe gly ser arg pro 
151/51 

CAT TCG TGG TCA AGG CCG GCG CGG CAG GAC 
his ser trp ser arg pro ala arg gin asp 
211/71 

TCG ACC TGC CCC AGG TTG CTC GTG CGC CTG 
ser thr cys pro arg leu leu val arg leu 
271/91 

CGC CGT CGA CGA TCC GGC AGG GCA CGT CAG 
arg arg arg arg ser gly arg ala arg gin 
331/111 

AGC ACG GAC CCG GCA TGC CGC GGG TCT CGG 
ser thr asp pro ala cys arg gly ser arg 
391/131 

TCG CGG TGT CGA GCA CGC TGG GCC GAA ACC 
ser arg cys arg ala arg trp ala glu thr 



SEQ ID N° 8A 



FIGURE 8A 



TTT GCG TGA TGT CCA ATG GCG AAA ACG ACG 
phe ala OPA cys pro met ala lys thr thr 
62/21 

AGT TTT CGC GAT GAC GCT CGT TCT GAC CGG 
ser phe arg asp asp ala arg ser asp arg 
122/41 

GCG AAC CGT CGA TTC CAT GGG TGT CGA CGC 
ala asn arg arg phe his gly cys arg arg 
182/61 

GTT CCT GGG TTC GAC ACC ATT CGC CCA AAT 
val pro gly phe asp thr ile arg pro asn 
242/81 

CGT CTT GGC TGC CGC CCC ACT AGC GAC TGC 
arg leu gly cys arg pro thr ser asp cys 
302/101 

GCG AAA CGT CAC CGC GTT CGG GGC ACC AGA 
ala lys arg his arg val arg gly thr arg 
362/121 

CGG TCG GGC GCC ATC GAC GCC GGA CGA GGT 
arg ser gly ala ile asp ala gly arg gly 
422/141 

CGG CGA CGA TC 
arg arg arg 



32/11 

CCT TGT CAT CGC AAT CGT CAG CAC CGG CCT 
pro cys his arg asn arg gin his arg pro 
92/31 

ACT TGT GAA CGG GTT TCG GGT CGA GGC CGA 
thr cys glu arg val ser gly arg gly arg 
152/51 

ATT CGT GGT CAA GGC CGG CGC GGC AGG ACC 
ile arg gly gin gly arg arg gly arg thr 
212/71 

CGA CCT GCC CCA GGT TGC TCG TGC GCC TGG 
arg pro ala pro gly cys ser cys ala tro 
272/91 

GCC GTC GAC GAT CCG GCA GGG CAC GTC AGC 
ala val asp asp pro ala gly his val ser 
332/111 

GCA CGG ACC CGG CAT GCC GCG GGT CTC GGA 
ala arg thr arg his ala ala gly leu gly 
392/131 

CGC GGT GTC GAG CAC GCT GGG CCG AAA CCT 
arg gly val glu his ala gly pro lys pro 



SEQ ID N° 8B 



FEUILLE DE REMF^ftgpgE«5(REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



23/185 



33/11 



TTG CGT 


GAT 


GTC 


CAA 


TGG 


CGA AAA 


CGA 


CGC 


CTT GTC 


ATC 


GCA 


ATC 


GTC 


AGC 


ACC 


GGC 


CTA 


leu arg 


asp 


val 


gin 


trp 


arg lys 


arg 


arg 


leu val 


lie 


ala 


ile 


val 


ser 


thr gly 


leu 


63/21 


















yj/ ji 


















GTT TTC 


GCG 


ATG 


ACG 


CTC 


Gl 1 


CI G 


ACC 


GGA 


CTT GTG 


AAC 


GGG 


TTT 


CGG 


GTC 


GAG 


GCC 


GAG 


val phe 


ala 


met 


tnr 


leu 


... i 

val 


T All 

leu 


tnr 


/wit* 


leu val 


asn 


gly phe 


arg 


val 


glu ala 


glu 


123/41 


















10 0/ Dl 


















CGA ACC 


GTC 


GAT 


1 CC 




GGT 


GTC 


GAC 


/""/"•TV 

GCA 


TTC GTG 


GTC 


AAG 


GCC 


GGC 


GCG 


GCA 


GGA 


CCG 


arg thr 


val 


asp 


ser 


met 


gly 


val 


asp 


aia 


phe val 


val 


lys 


ala 


gly ala 


ala 


gly 


pro 


183/61 


















ZlJ/ / 1 


















TTC CTG 


GGT 


1 CG 


ACA 


OLA 


TTC 


GCC 


C* TV A 

CAA 


A1C 


GAC CTG 


CCC 


CAG 


GTT 


GCT 


CGT 


GCG 


CCT 


GGC 


phe leu gly 


se r 


t-hr 

will. 




phe 


ala 


gin 




sen 1 an 

a&p IcU 


pro 


gin val 


ala 


arg 


ala 


pro 


gly 


243/81 


















273/91 


















GTC TTG 


GCT 


GCC 


GCC 


CCA 


CTA 


GCG 


ACT 


GCG 


CCG TCG 


ACG 


ATC 


CGG 


CAG 


GGC 


ACG 


TCA 


GCG 


val leu 


ala 


ala 


ala 


pro 


leu 


ala 


thr 


ala 


pro ser 


thr 


ile 


arg 


gin 


gly thr 


ser 


ala 


303/101 


















333/111 


















CGA AAC 


GTC 


ACC 


GCG 


TTC 


GGG 


GCA 


CCA 


GAG 


CAC GGA 


CCC 


GGC 


ATG 


CCG 


CGG 


GTC 


TCG 


GAC 


arg asn 


val 


thr 


ala 


phe 


gly 


ala 


pro 


glu 


his gly 


pro 


gly met 


pro 


arg 


val 


ser 


asp 


363/121 


















393/131 


















GGT CGG 


GCG 


CCA 


TCG 


ACG 


CCG 


GAC 


GAG 


GTC 


GCG GTG 


TCG 


AGC 


ACG 


CTG 


GGC 


CGA 


AAC 


CTC 


gly arg 


ala 


pro 


ser 


thr 


pro 


asp 


glu 


val 


ala val 


ser 


ser 


thr 


leu 


gly arg 


asn 


leu 



423/141 
GGC GAC GAT C 
gly asp asp 

SEQ ID N° 8C 
FIGURE 8C 



partie de la sequence nucleotidique de seq8A 



1/1 31/11 



CAG GTT 


GCT 


CGT 


GCG 


CCT 


GGC 


GTC 


TTG 


GCT 


GCC GCC 


CCA 


CTA 


GCG 


ACT 


GCG 


CCG 


TCG 


ACG 


gin val 


ala 


arg 


ala 


pro 


gly val 


leu 


ala 


ala ala 


pro 


leu 


ala 


thr 


ala 


pro 


ser 


thr 


61/21 


















91/31 


















ATC CGG 


CAG 


GGC 


ACG 


TCA 


GCG 


CGA 


AAC 


GTC 


ACC GCG 


TTC 


GGG 


GCA 


CCA 


GAG 


CAC 


GGA 


CCC 


ile arg 


gin 


gly 


thr 


ser 


ala 


arg 


asn 


val 


thr ala 


phe 


gly ala 


pro 


glu his 


gly pro 


121/41 


















151/51 


















GGC ATG 


CCG 


CGG 


GTC 


TCG 


GAC 


GGT 


CGG 


GCG 


CCA TCG 


ACG 


CCG 


GAC 


GAG 


GTC 


GCG 


GTG 


TCG 


gly met pro 


arg 


val 


ser 


asp 


gly 


arg 


ala 


pro ser 


thr 


pro 


asp 


glu 


val 


ala 


val 


ser 


181/61 




































AGC ACG 


CTG 


GGC 


CGA 


AAC 


CTC 


GGC 


GAC 


GAT 


C 


















ser thr 


leu 


gly 


arg 


asn 


leu 


gly 


asp 


asp 





















SEQ ID N° 8A' 
FIGURE 8A* 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



24/185 



PCT/FR98/01813 



1/1 

AGG TTG CTC GTG CGC CTG GCG TCT TGG CTG 
arg leu leu val arg leu ala ser trp leu 
61/21 

TCC GGC AGG GCA CGT CAG CGC GAA ACG TCA 
ser gly arg ala arg gin arg glu thr ser 
121/41 

GCA TGC CGC GGG TCT CGG ACG GTC GGG CGC 
ala cys arg gly ser arg thr val gly arg 
181/61 

GCA CGC TGG GCC GAA ACC TCG GCG ACG ATC 
ala arg trp ala glu thr ser ala thr ile 



31/11 

CCG CCC CAC TAG CGA CTG CGC CGT CGA CGA 
pro pro his AMB arg leu arg arg arg arg 
91/31 

CCG CGT TCG GGG CAC CAG AGC ACG GAC CCG 
pro arg ser gly his gin ser thr asp pro 
151/51 

CAT CGA CGC CGG ACG AGG TCG CGG TGT CGA 
his arg arg arg thr arg ser arg cys arg 



SEQ ID N° 8B' 



FIGURE 8B' 



Seq8C 
1/1 

CCA GGT TGC TCG TGC GCC TGG 
pro gly cys ser cys ala trp 
61/21 

GAT CCG GCA GGG CAC GTC AGC 
asp pro ala gly his val ser 
121/41 

CGG CAT GCC GCG GGT CTC GGA 
arg his ala ala gly leu gly 
181/61 

GAG CAC GCT GGG CCG AAA CCT 
glu his ala gly pro lys pro 



31/11 

CGT CTT GGC TGC CGC CCC 
arg leu gly cys arg pro 
91/31 

GCG AAA CGT CAC CGC GTT 
ala lys arg his arg val 
151/51 

CGG TCG GGC GCC ATC GAC 
arg ser gly ala ile asp 

CGG CGA CGA TC 
arg arg arg 



ACT AGC GAC TGC GCC GTC GAC 
thr ser asp cys ala val asp 

CGG GGC ACC AGA GCA CGG ACC 
arg gly thr arg ala arg thr 

GCC GGA CGA GGT CGC GGT GTC 
ala gly arg gly arg gly val 



SEQ ID N° 8C ! 



FIGURE 8C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



sequence Rv2563 


predite 


par 


Cole et 


al. 


ata 
met 
121/41 


















ctt ttt 
leu phe 
181/61 


oca 
ala 


act 
ala 


tta 
y 

leu 


cat 
arg 


gat 
asp 


gtc 
vai 


caa 
gin 


tgg 
trp 


age acc 
ser thr 
241/81 


crac 
gly 


eta 
leu 


att 
y ^ v - 

val 


ttc 
phe 


gcg 
ala 


a tg 
met 


acg 
thr 


etc 
leu 


gtc gag 
vai glu 
301/101 


gec 
ala 


gag 
glu 


caa 
arg 


acc 
thr 


gtc 
vai 


aa t 
asp 


tee 
ser 


atg 
met 


aca aca 
ala ala 
361/121 


aaa 

y yo 

gly 


ccg 
pro 


ttc 
phe 


ctg 
leu 


ggt 
gly 


ser 


aca 
thr 


cca 
pro 


cat aca 

wy y*-y 

arg ala 
421/141 


cct 
pro 


aac 

y y 

gly 


gtc 
vai 


ttg 
leu 


get 
ala 


y cc 
ala 


y t-t.. 

ala 


cca 
pro 


ggc acg 
gly thr 
481/161 


tea 
ser 


ala 


cga 
arg 


aac 
asn 


gtc 
vai 


a cc 
thr 


gcg 
ala 


ttc 
phe 


egg gtc 
arg vai 
541/181 


t eg 
ser 


gac 
asp 


yy L 
gly 


egg 
arg 


gcg 
ala 


cca 
pro 


teg 
ser 


acg 
thr 


aac caa 
gly arg 
601/201 


aac 
asn 


etc 
leu 


aac 
y y ^ 

gly 


gac 
asp 


gat 
asp 


ccy 

leu 


gin 


gtg 
val 


ota ccc 
vai pro 
661/221 


aaa 
glu 


tea 
ser 


acc 
thr 


n en 

y <-y 
ala 


ctg 
leu 


gca 
ala 


aag 
lys 


att 
ile 


caa caa 

w 3 w*y 

gin gin 
721/241 


tta 
*- ^-y 

leu 


gca 
ala 


tac 
tyr 


aac 
asn 


gga 
gly 


way 

gin 


ccg 
pro 


aca 
thr 


caa caa 
arg gin 
781/261 


ct c 
leu 


ccg 
pro 


gac 
asp 


ggc 
gly 


tat 
tyr 


cag 
gin 


acc 
thr 


gtc 
val 


cac cca 
arg pro 
841/281 


tta 
*-<-y 

leu 


aag 
lys 


gtc 
vai 


y uy 

ala 


gtg 
vai 


y ct u 

asp 


gcg 
ala 


ate 
ile 


gcg gcg 
ala ala 
901/301 


ttg 
leu 


ate 
ile 


gtc 
vai 


aac 
gly 


teg 
ser 


y uy 

val 


y ut. 

val 


tac 
tyr 


gcg gtg 
ala vai 
961/321 


ttc 
phe 


aag 
lys 


aca 
y *-y 

ala 


ate 
ile 


ggc 
gly 


y uy 

val 


y 

pro 


acg 
thr 


gcg gtc gtc 
ala vai vai 
1021/341 


ate 
vai 


aca 
y u y 

ala 


eta 
leu 


etc 
leu 


y <_y 

ala 


gcg 
ala 


gtg 
val 


ccg ttg ttc 
pro leu phe 
1081/361 


ccg 
pro 


atg 
met 


act 
thr 


gtc 
vai 


gtg 
val 


gta 
val 


ccc 
pro 


gcg act gtg 
ala thr vai 
1141/381 


ate 
ile 


ggt 
gly 


ctg 
leu 


ctg 
leu 


gee 
ala 


age 
ser 


gtc 
val 


ccg gca 
pro ala 


eta 

leu 


gcg 
ala 


ttc 
phe 


gga 
gly 


ggt 
gly 


ccc 
pro 


tag 
AM 3 





SEQ 



/185 

(Nature 393:537-544) et contenant seq8A* 



151/51 

cga aaa cga cgc ctt gtc ate gca ate gtc 
arg lys arg arg leu val ile ala ile val 
211/71 

gtt ctg acc gga ctt gtg aac ggg ttt egg 
val leu thr gly leu val asn gly phe arg 
271/91 

ggt gtc gac gca ttc gtg gtc aag gec ggc 
gly val asp ala phe val val lys ala gly 
331/111 

ttc gee caa ate gac ctg ccc cag gtt get 
phe ala gin ile asp leu Dro gin val ala 
391/131 

eta gcg act gcg ccg teg acg ate egg cag 
leu ala thr ala pro ser thr ile arg gin 
451/151 



ggg gca 


cca 


gag 


cac 


gga 


ccc 


ggc 


atg 


ccg 


gly ala 


pro 


glu 


his 


gly 


pro 


gly 


met 


pro 


511/171 
















ccg gac 


gag 


gtc 


gcg 


gtg 


teg 


age 


acg 


ctg 


pro asp 


glu 


val 


ala 


val 


ser 


ser 


thr 


leu 



571/191 



ggt gcg 


cgc 


act 


ttg 


egg 


ate 


gtc 


ggc ate 


gly ala 


arg 


thr 


leu 


arg 


ile 


val 


gly ile 


631/211 














ccc aac 


ate 


ttc 


ctg 


acc 


acc 


gaa 


ggc eta 


pro asn 


ile 


phe 


leu 


thr 


thr 


glu 


gly leu 


691/231 












ate agt 


teg 


ate 


ggg 


ate 


gac 


ggg 


atg ccc 


ile ser 


ser 


ile 


gly 


ile 


asp 


gly 


met pro 


751/251 














aat cga 


gcg 


gat 


get 


gtc 


age 


gat 


ctg atg 


asn arg 


ala 


asp 


ala 


val 


ser 


aso 


leu met 



811/271 

acg gtt gtg gcg gtc ttg ctg tgg ate gtt 
thr val val ala val leu leu trD ile val 
871/291 



etc tct gcg ttg gag egg ctg cgt gac ttt 

leu ser ala leu glu arg leu arg asp phe 
931/311 

cgc teg att ctg gee ggg ctg gcg ctg cag 

arg ser ile leu ala gly leu ala leu gin 
991/331 

gtt ggc ggc ate ctt teg ctg etc ttg gcg 

val gly gly ile leu ser leu leu leu ala 
1051/351 

ctg agt gee ttc gtg gcg eta ccg gcg ate 

leu ser ala phe val ala leu pro ala ile 
1111/371 

gca gga ctg egg cgc gtg gtg gcg ate gat 

ala gly leu arg arg val val aia ile asp 



N° 8D 



FEUILLE DE REMftKSSSEfl? (REGLE 26) 



WO 99/09186 



PCI7FR98/01813 



tgg 


gec 


gcg 


gcg 


cca 


ccg 


aag 


trp 


ala 


ala 


ala 


pro 


pro 


lys 


teg 


ccg 


atg 


ate 


teg 


acc 


gec 


ser 


pro 


met 


ile 


ser 


thr 


ala 



thr 



26/185 

ORF predite parjTole et al. (Nature 393:537-544) ei 
VI 31/11 

tag gtt tea aga agg cct gtg cag gtt tec gca gec 

AMB val ser arg arg pro val gin val ser ala ala 
61/21 91/31 

ccg ccg aaa tgg get aat egg gtt cgc ttg get cga 

pro pro ly3 trp ala asn arg val arg leu ala arc 
121/41 151/51 

acc gac ccc etc acc teg gtc gaa cct egg cga acc aac gcg gca acg cca gec cat gat 

thr asp pro leu thr ser val glu pro arg arg thr asn ala ala thr pro ala his asp 
181/61 211/71 

cat ttg att ggg tec acg gaa gca ggt age ttc cgt cgc atg ctt ttt gcg get ttg cgt 

his leu lie gly ser thr glu ala gly ser phe arg arg met leu phe ala ala leu ara 
241/81 271/91 

gat gtc caa tgg cga aaa cga cgc ctt gtc ate gca ate gtc age acc ggc eta gtt ttc 

asp val gin trp arg lys arg arg leu val ile ala ile val ser thr gly leu val phe 
301/101 331/111 

gcg atg acg etc gtt ctg acc gga ctt gtg aac ggg ttt egg gtc gag gee gag cga acc 

ala met thr leu val leu thr gly leu val asn gly phe arg val glu ala glu arc thr 
361/121 391/131 

gtc gat tec atg ggt gtc gac gca ttc gtg gtc aag gee ggc gcg gca gga ccg ttc ctg 

val asp ser met gly val asp ala phe val val lys ala gly ala ala gly pro phe leu 
421/141 451/151 

ggt teg aca cca ttc gee caa ate gac ctg ccc cag gtt get cgt gcg cct ggc gtc ttg 

gly ser thr pro phe ala gin ile asp leu pro gin val ala arg ala pro gly val leu 
481/161 511/171 

get gec gee cca eta gcg act gcg ccg teg acg ate egg cag ggc acg tea gcg cga aac 

ala ala ala pro leu ala thr ala pro ser thr ile arg gin gly thr ser ala arg asn 
541/181 571/191 

gtc acc gcg ttc ggg gca cca gag cac gga ccc ggc atg ccg egg gtc teg gac ggt egg 

val thr ala phe gly ala pro glu his gly pro gly met pro arg val ser asp glv ara 
601/201 631/211 

gcg cca teg acg ccg gac gag gtc gcg gtg teg age acg ctg ggc cga aac etc ggc gac 

ala pro ser thr pro asp glu val ala val ser ser thr leu gly arg asn leu gly aso 
661/221 6917231 

gat ctg caa gtg ggt gcg cgc act ttg egg ate gtc ggc ate gtg ccc gag tea acc gcg 

asp leu gin val gly ala arg thr leu arg ile val gly ile val pro glu ser thr ala 
721/241 751/251 

ctg gca aag att ccc aac ate ttc ctg acc acc gaa ggc eta cag cag ttg gca tac aac 

leu ala lys ile pro asn ile phe leu thr thr glu gly leu gin gin leu ala tyr asn 
781/261 811/271 

gga cag ccg aca ate agt teg ate ggg ate gac ggg atg ccc cga cag etc ccg gac ggc 

gly gin pro thr ile ser ser ile gly ile asp gly met pro arg gin leu pro asp glv 
841/281 871/291 

tat cag acc gtc aat cga gcg gat get gtc age gat ctg atg cgc ccg ttg aag gtc gcg 

tyr gin thr val asn arg ala asp ala val ser asp leu met arg pro leu lys val ala 
901/301 931/311 

gtg gat gcg ate acg gtt gtg gcg gtc ttg ctg tgg ate gtt gcg gcg ttg ate gtc ggc 

val asp ala ile thr val val ala val leu leu trp ile val ala ala leu ile val glv 
961/321 991/331 

teg gtg gtc tac etc tct gcg ttg gag egg ctg cgt gac ttt gcg gtg ttc aag gcg ate 

ser val val tyr leu ser ala leu glu arg leu arg asp phe ala val phe lys ala ile 
1021/341 1051/351 

ggc gtg ccg acg cgc teg att ctg gec ggg ctg gcg ctg cag gcg gtc gtc gtc gcg ctg 

gly val pro thr arg ser ile leu ala gly leu ala leu gin ala val val val ala leu 
1081/361 1111/371 

etc gcg gcg gtg gtt ggc ggc ate ctt teg ctg ctg ttg gcg 

leu ala ala val val gly gly ile leu ser leu leu leu ala 
1141/381 1171/391 

gtc gtg gta ccc ctg agt gee ttc gtg gcg eta ccg gcg ate 

val val val pro leu ser ala phe val ala leu pro ala ile 
1201/401 1231/411 

ctg gee age gtc gca gga ctg egg cgc gtg gtg gcg ate gat 

leu ala ser val ala gly leu arg arg val val ala ile asp 
1261/421 
ggt ccc tag 
gly pro AMB 

SEQ ID N° 8F 
FEUILLE DE REMftKftSfflEflT (REGLE 26) 



ccg 


ttg 


ttc 


ccg 


pro 


leu 


phe 


pro 


gcg 


act 


gtg 


ate 


ala 


thr 


val 


ile 


ccg 


gca 


eta 


gcg 


pro 


ala 


leu 


ala 



WO 99/09186 



PCT/FR98/01813 



27/185 



sequence de Rv0072 predite par par Cole et al. (Nature 393:537-544) et 
presentant plus de 77% de similarity avec Seq8D* 
1/1 31/11 

atg etc ttc gcg gec ctg cgt gac atg caa tgg aga aag cgc cgc ctg gtc ate acg ate 
Met leu phe ala ala leu arg asp met gin trp arg lys arg arg leu val ile thr ile 
61/21 91/31 

ate age ace ggg ctg ate ttc ggg atg acg ctt gtt ttg ace gga etc gcg aac ggc ttc 
ile ser thr gly leu ile phe gly met thr leu val leu thr gly leu ala asn gly phe 
121/41 151/51 

egg gtg gag gee egg cac acc gtc gat tec atg ggt gtc gat gta ttc gtc gtc aga tec 
arg val glu ala arg his thr val asp ser met gly val asp val phe val val arg ser 
181/61 211/71 

ggc get get gga cct ttt ctg ggt tea ata ccg ttt ccc gat gtt gac ctg gee cga gtg 
gly ala ala gly pro phe leu gly ser ile pro phe pro asp val asp leu ala arg val 
241/81 271/91 

gee get gaa ccc ggt gtc atg gec gcg gee ccg ttg ggc age gtg ggg acg ate atg aaa 
ala ala glu pro gly val met ala ala ala pro leu gly ser val gly thr ile met lys 
301/101 331/111 

gaa ggc acg teg acg cga aac gtc acg gtc ttc ggc gcg ccc gag cac gga cct ggc atg 
glu gly thr ser thr arg asn val thr val phe gly ala pro glu his gly pro gly met 
361/121 391/131 

cca egg gtc tea gag ggt egg tea ccg teg aaa ccg gac gaa gtc gcg gca teg age acg 
pro arg val ser glu gly arg ser pro ser lys pro asp glu val ala ala ser ser thr 
421/141 451/151 

atg ggc cga cac etc ggt gac act gtc gag gtc ggc gcg cgc aga ttg egg gtc gtt ggc 
met gly arg his leu gly asp thr val glu val gly ala arg arg leu arg val val gly 
481/161 511/171 

att gtg ccg aat tec acc gcg ctg gec aag ate ccc aat gtc ttc etc acg acc gag ggc 
ile val pro asn ser thr ala leu ala lys ile pro asn val phe leu thr thr glu gly 
541/181 . 571/191 

tta cag aaa ttg gcg tac aac ggg cag ccg aat ate acg tec ate ggg ate ata ggt atg 
leu gin lys leu ala tyr asn gly gin pro asn ile thr ser ile gly ile ile gly met 
601/201 631/211 

ccc cga cag ctg ccg gag ggt tac cag act ttc gat egg gtg ggc get gtc aat gat ttg 
pro arg gin leu pro glu gly tyr gin thr phe asp arg val gly ala val asn asp leu 
661/221 691/231 

gtg cgc cca ttg aag gtc gca gtg aat teg ate teg ate gtg get gtt ttg ctg tgg att 
val arg pro leu lys val ala val asn ser ile ser ile val ala val leu leu trp ile 
721/241 751/251 

gtg gcg gtg ctg ate gtc ggc teg gtg gtg tac ctt teg get ctt gag egg eta cgt gac 
val ala val leu ile val gly ser val val tyr leu ser ala leu glu arg leu arg asp 
781/261 811/271 

ttc gcg gtg ttc aag gcg att ggc acg cca acg cgc teg att atg gee ggg etc gca tta 
phe ala val phe lys ala ile gly thr pro thr arg ser ile met ala gly leu ala leu 
841/281 871/291 

cag gcg ctg gtc att gcg ttg ctt gcg gcg gtg gtg ggc gtc gtc ctg gcg cag gtg ttg 
gin ala leu val ile ala leu leu ala ala val val gly val val leu ala gin val leu 
901/301 931/311 

gca cca ctg ttt ccg atg att gtc gcg gta ccc gtc ggt get tac ctg gcg eta ccg gtg 
ala pro leu phe pro met ile val ala val pro val gly ala tyr leu ala leu pro val 
961/321 991/331 

gec gcg ate gtc ate ggt ctg ttc get agf gtt gec gga ttg aag cgc gtg gtg acg gtc 
ala ala ile val ile gly leu phe ala ser val ala gly leu lys arg val val thr val 
1021/341 

gat ccc gcg cag gcg ttc gga ggt ccc tag 
asp pro ala gin ala phe gly gly pro AMB 



SEQ ID N° 8G 



FEUILLE DE REMP£A@©fife#P(REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



28/185 



Seq8H i ORF predite par Cole et al. (Nat 
1/1 

tag cct ctg gga atg etc ttc gcg gec ctg 
AMB pro leu gly met leu phe ala ala leu 
61/21 

gtc ate acg ate ate age ace ggg ctg ate 
val ile thr ile ile ser thr gly leu ile 
121/41 

gcg aac ggc ttc egg gtg gag gee egg cac 
ala asn gly phe arg val glu ala arg his 
181/61 

gtc gtc aga tec ggc get get gga cct ttt 
val val arg ser gly ala ala gly pro phe 
241/81 

ctg gec cga gtg gee get gaa ccc ggt gtc 
leu ala arg val ala ala glu pro gly val 
301/101 

acg ate atg aaa gaa ggc acg teg acg cga 
thr ile met lys glu gly thr ser thr arg 
361/121 

gga cct ggc atg cca egg gtc tea gag ggt 
gly pro gly met pro arg val ser glu gly 
421/141 

gca teg age acg atg ggc cga cac etc ggt 
ala ser ser thr met gly arg his leu gly 
481/161 

egg gtc gtt ggc att gtg ccg aat tec acc 
arg val val gly ile val pro asn ser thr 
541/181 

acg acc gag ggc tta cag aaa ttg gcg tac 
thr thr glu gly leu gin lys leu ala Xyz 
601/201 

ate ata ggt atg ccc cga cag ctg ccg gag 
ile ile gly met pro arg gin leu pro glu 
661/221 

gtc aat gat ttg gtg cgc cca ttg aag gtc 
val asn asp leu val arg pro leu lys val 
721/241 

ttg ctg tgg att gtg gcg gtg ctg ate gtc 
leu leu trp ile val ala val leu ile val 
781/261 

egg eta cgt gac ttc gcg gtg ttc aag gcg 
arg leu arg asp phe ala val phe lys ala 
841/281 

ggg etc gca tta cag gcg ctg gtc att gcg 
gly leu ala leu gin ala leu val ile ala 
901/301 

gcg cag gtg ttg gca cca ctg ttt ccg atg 
ala gin val leu ala pro leu phe pro met 
961/321 

gcg eta ccg gtg gec gcg ate gtc ate ggt 
ala leu pro val ala ala ile val ile gly 
1021/341 

gtg gtg acg gtc gat ccc gcg cag gcg ttc 
val val thr val asp pro ala gin ala phe 



ure 393:537-544) et contenant seq8G 
31/11 

cgt gac atg caa tgg aga aag cgc cgc ctg 
arg asp met gin trp arg lys arg arg leu 
91/31 

ttc ggg atg acg ctt gtt ttg acc gga etc 
phe gly met thr leu val leu thr gly leu 
151/51 

acc gtc gat tec atg ggt gtc gat gta ttc 
thr val asp ser met gly val asp val phe 
211/71 

ctg ggt tea ata ccg ttt ccc gat gtt gac 
leu gly ser ile pro phe pro asp val asp 
271/91 

atg gee gcg gec ccg ttg ggc age gtg ggg 
met ala ala ala pro leu gly ser val gly 
331/111 

aac gtc acg gtc ttc ggc gcg ccc gag cac 
asn val thr val phe gly ala pro glu his 
391/131 

egg tea ccg teg aaa ccg gac gaa gtc gcg 
arg ser pro ser lys pro asp glu val ala 
451/151 

gac act gtc gag gtc ggc gcg cgc aga ttg 
asp thr val glu val gly ala arg arg leu 
511/171 

gcg ctg gec aag ate ccc aat gtc ttc etc 
ala leu ala lys ile pro asn val phe leu 
571/191 

aac ggg cag ccg aat ate acg tec ate ggg 
asn gly gin pro asn ile thr ser ile gly 
631/211 

ggt tac cag act ttc gat egg gtg ggc get 
gly tyr gin thr phe asp arg val gly ala 
691/231 

gca gtg aat teg ate teg ate gtg get gtt 
ala val asn ser ile ser ile val ala val 
751/251 

ggc teg gtg gtg tac ctt teg get ctt gag 
gly ser val val tyr leu ser ala leu glu 
811/271 

att ggc acg cca acg cgc teg att atg gec 
ile gly thr pro thr arg ser ile met ala 
871/291 

ttg ctt gcg gcg gtg gtg ggc gtc gtc ctg 
leu leu ala ala val val gly val val leu 
931/311 

att gtc gcg gta ccc gtc ggt get tac ctg 
ile val ala val pro val gly ala tyr leu 
991/331 

ctg ttc get agt gtt gec gga ttg aag cgc 
leu phe ala ser val ala gly leu lys arg 
1051/351 
gga ggt ccc tag 
gly gly pro AMB 



SEQ ID N° 8H 
FEUILLE DE REMFOKJEWfEfiT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



29/185 















31/11 


















CGA GGC CGA GCG 


AAC 


CGT CGA 


TTC 


CAT 


GGG 


TGT CGA 


CGC 


ATT 


CGT 


GGT 


CAA 


GGC 


CGG 


CGC 


arg gly arg ala 


asn 


arg arg phe his 


alv 


cvs arcr 


arc 


ile arg qly gin 


gly arg 


arg 


61/21 












91/31 


















GGC AGG ACC GTT 


CCT 


GGG TTC 


GAC 


ACC 


ATT 


CGC CCA 


AAT 


CGA 


CCT 


GCC 


CCA 


GGT 


TGC 


TCG 


gly arg thr val 


pro 


gly phe 


asp 


thr 


ile 


arq pro 


asn 


arg 


pro 


ala 


pro gly cys 


ser 


121/41 












151/51 


















TGC GCC TGG CGT 


CTT 


GGC TGC 


CGC 


CCC 


ACT 


AGC GAC 


TGC 


GCC 


GTC 


GAC 


GAT 


CCG 


GCA 


GGG 


cys ala trp arg leu gly cys 


arg 


pro 


thr 


ser asp 


cys 


ala 


val 


asp 


asp 


pro 


ala 


gly 


181/61 












211/71 
















CAC GTC AGC GCG 


AAA 


CGT CAC 


CGC 


GTT 


CGG 


GGC ACC 


AGA 


GCA 


CGG 


ACC 


CGG 


CAT 


GCC 


GCG 


his val ser ala 


lys 


arg his 


arg 


val 


arg 


gly thr 


arg 


ala 


arg 


thr 


arg 


his 


ala 


ala 


241/81 












271/91 


















GGT CTC GGA CGG 


TCG 


GGC GCC 


ATC 


GAC 


GCC 


GGA CGA 


GGT 


CGC 


GGT 


GTC 


GAG 


CAC 


GCT 


GGG 


gly leu gly arg 


ser 


gly ala 


ile 


asp 


ala 


gly arg 


gly arg gly val 


glu his 


ala 


gly 



301/101 
CCG AAA CCT CGG CGA CGA TC 
pro lys pro arg arg arg 



SEQ ID N° 9A 
FIGURE 9A 



32/11 



GAG GCC GAG 


CGA 


ACC 


GTC 


GAT 


TCC 


ATG 


GGT 


GTC GAC 


GCA 


TTC 


GTG 


GTC 


AAG 


GCC 


GGC 


GCG 


glu ala glu 


arg 


thr 


val 


asp 


ser 


met 


gly 


val asp 


ala 


phe 


val 


val 


lys 


ala 


gly 


ala 


62/21 
















92/31 


















GCA GGA CCG 


TTC 


CTG 


GGT 


TCG 


ACA 


CCA 


TTC 


GCC CAA 


ATC 


GAC 


CTG 


CCC 


GAG 


GTT 


GCT 


CGT 


ala gly pro 


phe 


leu 


gly 


ser 


thr 


pro 


phe 


ala gin 


ile 


asp 


leu 


pro 


gin 


val 


ala 


arg 


122/41 
















152/51 


















GCG CCT GGC 


GTC 


TTG 


GCT 


GCC 


GCC 


CCA 


CTA 


GCG ACT 


GCG 


CCG 


TCG 


ACG 


ATC 


CGG 


CAG 


GGC 


ala pro gly 


val 


leu 


ala 


ala 


ala 


pro 


leu 


ala thr 


ala 


pro 


ser 


thr 


ile 


arg gin 


gly 


182/61 
















212/71 
















ACG TCA GCG 


CGA 


AAC 


GTC 


ACC 


GCG 


TTC 


GGG 


GCA CCA 


GAG 


CAC 


GGA 


CCC 


GGC 


ATG 


CCG 


CGG 


thr ser ala 


arg 


asn 


val 


thr 


ala 


phe 


gly 


ala pro 


glu 


his 


gly pro 


gly 


met 


pro 


arg 


242/81 
















272/91 


















GTC TCG GAC 


GGT 


CGG 


GCG 


CCA 


TCG 


ACG 


CCG 


GAC GAG 


GTC 


GCG 


GTG 


TCG 


AGC 


ACG 


CTG 


GGC 


val ser asp 


gly 


arg 


ala 


pro 


ser 


thr 


pro 


asp glu 


val 


ala 


val 


ser 


ser 


thr 


leu 


gly 



302/101 
CGA AAC CTC GGC GAC GAT C 
arg asn leu gly asp asp 

SEQ ID N° 9B 
FIGURE 9B 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



30/185 



33/11 



AGG CCG 


AGC 


GAA 


CCG 


x w 


ATT 

f\ X X 


CPA 


TGG 


GTG 


Ten, i\m 

x\*\j nLu 


cat 

UA1 


TCC 


TCC 


1 CA 


AOCj 


CCG 


GCG 


CGG 


arg pro 


ser 


glu pro 


s er 


lie 


pro 


trp 


vai 


ser thr 


nis 


ser 


trp 


ser 


arg 


pro 


ala 


arg 


63/21 

\J<J f Cm X 


















30/ Jl 












fAG GAC 


CGT 


TCC 


TGG 


GTT 


CGA 


CAC 


CAT 


TPG 
1 LU 


err aaa 


TCC 
x Lo 


n.cc 


1 bC 


CCC 


AGG 


TTG 


CTC 


GTG 


gin asp 


arg 


ser 


trp 


val 


arg 


his 


his 


ser 


pro lys 


ser 


thr 


cys 


pro 


arg 


leu 


leu 


val 


I/. J/ 41 


















1 CO / CI 

133/ 51 












CGC CTG 


GCG 


TCT 


TGG 


CTG 


CCG 


CCC 


CAC 


TAG 


CGA CTG 


CGC 


CGT 


CGA 


CGA 


TCC 


GGC 


AGG 


GCA 


arg leu 


ala 


ser 


trp 


leu 


pro 


pro 


his 


AMB 


arg leu 


arg 


arg 


arg 


arg 


ser 


gly 


arg 


ala 


183/61 


















213/71 














CGT CAG 


CGC 


GAA ACG 


TCA 


CCG 


CGT 


TCG 


GGG 


CAC CAG 


AGC 


ACG 


GAC 


CCG 


GCA 


TGC 


CGC 


GGG 


arg gin 


arg glu thr 


ser 


pro 


arg 


ser 


gly 


his gin 


ser 


thr 


asp 


pro 


ala 


cys 


arg gly 


243/81 


















273/91 
















TCT CGG 


ACG 


GTC 


GGG 


CGC 


CAT 


CGA 


CGC 


CGG 


ACG AGG 


TCG 


CGG 


TGT 


CGA 


GCA 


CGC 


TGG 


GCC 


ser arg 


thr 


val 


gly arg his 


arg 


arg 


arg 


thr arg 


ser 


arg 


cys 


arg 


ala 


arg 


trp 


ala 


303/101 






























GAA ACC 


TCG 


GCG 


ACG 


ATC 




























glu thr.ser ala 


thr 


ile 










































SEQ ID N° 9C 
































FIGURE 9C 




































31/11 


















TTA ACG 


ACT 


CAG 


ACG 


GAA ACG 


LI 1 


GAA 


CCG 


CGA GGT 


C<jC 


TCC 


GGA 


CAC 


CAA 


TTT 


GAC 


TCG 


leu thr 


thr 


gin 


thr glu 


thr 


leu 


glu 


pro 


arg gly 


arg 


ser 


gly his 


gin 


phe 


asp 


ser 


61/21 


















91/31 












GCT CTT 


TGG ,CAA TTG 


AAG 


GTG 


AvjC 


TGC 


GAG 


CAG CCG 


GGT 


GAC 


CGC 


ATC 


GTT 


GGC 


CTT 


GCC 


ala leu 


trp 


gin 


leu 


lys 


val 


ser 


cys 


glu gin pro 


gly 


asp 


arg 


ile 


val 


gly leu 


ala 


121/41 


















151/51 


















ATC AAT 


CGC 


CGG 


CTC 


GCG 


GAC 




GAT 


AAT 


CAG CTC 


ACC 


GTT 


GGG 


ACC 


GAC 


CTC 


GAC 


CAG 


ile asn 


arg 


arg 


leu 


ala 


asp 


val 


asp 


asn 


gin leu 


thr 


val 


gly thr 


asp 


leu 


asp 


gin 


181/61 


















211/71 












GGG TCC 


TTT 


GTG 


ACT 


GCC 


GGG 


L 1 A 


GAC 


GCG 


GAC GAC 


CAC 


AGA 


GTC 


GGT 


CAT 


CGC 


CTA 


AGG 


gly ser 


phe 


val 


thr 


ala gly 


1 an 

leu 


asp 


ala 


asp asp 


his 


arg 


val 


gly 


his 


arg 


leu 


arg 


241/81 


















271/91 














CTA CCG 


TTC 


TGA 


CCT 


GGG 


GCT 


GCG 


TGG 


GCG 


CCG ACG 


ACG 


1 bA 


GGC 


ACG 


TCA 


TGT 


CTC 


AGC 


leu pro 


phe 


OPA 


pro 


gly ala 


ala 


trp 


ala 


pro thr 


thr 


OPA 


gly 


thr 


ser 


cys 


leu 


ser 


301/101 


















331/111 














GGC CCA 


CCG 


CCA 


CCT 


CGG 


TCG 


CCG 


GCA 


GTA 


TGT CAG 


CAT 


GTG 


CAG 


ATG 


ACT 


CCA 


CGC 


AGC 


gly pro pro 


pro 


pro 


arg 


ser 


pro 


ala 


val 


cys gin his 


val 


gin met 


thr 


pro 


arg 


ser 


361/121 


















391/131 














CTT GTT 


CGC 


ATC 


GTT 


GGT 


GTC 


GTG 


GTT 


GCG 


ACG ACC 


TTG 


GCG 


CTG 


GTG 


AGC 


GCA 


CCC 


GCC 


leu val 


arg 


ile 


val 


gly 


val 


val 


val 


ala 


thr thr 


leu 


ala 


leu 


val 


ser 


ala 


pro 


ala 


421/141 


































GGC GGT 


CGT 


GCC 


GCG 


CAT 


GCG 


GAT 


C 






















gly gly 


arg 


ala 


ala 


his 


ala 


asp 

























SEQ ID N° 10A 
FIGURE 10A 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



31/185 



32/11 



TAA CGA 


CTC 


AGA 


CGG 


AAA 


^bL 


rnrnr* 
lib 


nap 


bbb 


bAb bib 


GCT 


CCG 


GAC 


ACC 


AAT 


TTG 


ACT 


CGG 


OCH arg 


leu 


arg 


arg 


lys 


d l~ y 


leu 


asn 


arg 


glu val 


aia 


pro 


asp 


thr 


asn 


leu 


thr 


arg 


62/21 
































CTC TTT 


GGC 


AAT 


TGA AGG 


1 bA 


bb 1 




Abb 


Abb CGG 


GTG 


ACC 


GCA 


TCG 


TTG 


GCC 


TTG 


CCA 


leu phe 


gly 


asn 


OPA 


arg 


OPA 
wen 


ax a 


aid 


ser 


ser arg 


... i 
vai 


tnr 


ala 


ser 


leu 


ala 


leu 


pro 


122/41 


































TCA ATC 


GCC 


GGC 


TCG 


CGG 


ACG 


TAG 


ATA 


Al b 


Abb 1 bA 


CCG 


TTG 


GGA 


CCG 


ACC 


TCG 


ACC 


AGG 


ser ile ala gly 


ser 


arg 


thr 


AMB 


ile 


•i 1 a 

xxe 


ser ser 


pro 


leu 


gly pro 


thr 


ser 


thr 


arg 


182/61 


















£. i.£.f / 1 
















GGT CCT 


TTG 


TGA 


CTG 


CCG 


GGC 


TTG 


ACG 


err 

tbb 


Abb Abb 


AbA 


GAG 


TCG 


GTC 


ATC 


GCC 


TAA 


GGC 


gly pro leu OPA leu pro 


gly 


leu 


thr 


arg 


tnr enr 


tnr 


glu 


ser 


val 


ile 


ala 


OCH gly 


242/81 


















010 /Q1 


















TAC CGT 


TCT 


GAC 


CTG 


GGG 


CTG 


CGT 


GGG 


CGC 


CGA CGA 


CGT 


GAG 


GCA 


CGT 


CAT 


GTC 


TCA 


GCG 


tyr arg 


ser 


asp leu gly leu 


arg gly 


arg 


arg arg 


arg 


glu 


ala 


arg 


his 


val 


ser 


ala 


302/101 


















jJi/ ill 
















GCC CAC 


CGC 


GAC 


CTC 


GGT 


CGC 


CGG 


CAG 


TAT 


GTC AGC 


ATG 


TGC 


AGA 


TGA 


CTC 


CAC 


GCA 


GCC 


ala his 


arg 


his 


leu 


gly 


arg 


arg gin 


tyr 


val ser 


met 


cys 


arg 


OPA 


leu 


his 


ala 


ala 


362/121 


















392/131 














TTG TTC 


GCA 


TCG 


TTG 


GTG 


TCG 


TGG 


TTG 


CGA 


CGA CCT 


TGG 


CGC 


TGG 


TGA 


GCG 


CAC 


CCG 


CCG 


leu phe 


ala 


ser 


leu 


val 


ser 


trp 


leu 


arg 


arg pro 


trp 


arg 


trp 


OPA 


ala 


his 


pro 


pro 


422/141 
































GCG GTC 


GTG 


CCG 


CGC 


ATG 


CGG 


ATC 
























ala val 


val 


pro 


arg 


met 


arg 


Ile 

























SEQ ID N° 10B 
FIGURE 10B 



33/11 



AAC GAC 


TCA 


GAC 


GGA 


AAC 


GCT 


TGA 


ACC 


GCG 


AGG TCG 


CTC 


CGG 


ACA 


CCA 


ATT 


TGA 


CTC 


GGC 


asn asp 


ser 


asp 


gly 


asn 


ala 


OPA 


thr 


ala 


arg ser 


leu 


arg 


thr 


pro 


ile 


OPA 


leu 


gly 


63/21 


















93/31 














TCT TTG 


GCA ATT 


GAA 


GGT 


GAG 


CTG 


CGA 


GCA 


GCC GGG 


TGA 


CCG 


CAT 


CGT 


TGG 


CCT 


TGC 


CAT 


ser leu 


ala 


ile 


glu 


gly 


glu 


leu 


arg 


ala 


ala gly OPA pro 


his 


arg 


trp 


pro 


cys 


his 


123/41 


















153/51 










CAA TCG 


CCG 


GCT 


CGC 


GGA 


CGT 


AGA 


TAA 


TCA 


GCT CAC 


CGT 


TGG 


GAC 


CGA 


CCT 


CGA 


CCA 


GGG 


gin ser 


pro 


ala 


arg gly 


arg 


arg 


OCH 


ser 


ala his 


arg 


trp 


asp 


arg 


pro 


arg 


pro 


gly 


183/61 


















213/71 












GTC CTT 


TGT 


GAC 


TGC 


CGG 


GCT 


TGA 


CGC 


GGA 


CGA CCA 


CAG 


AGT 


CGG 


TCA 


TCG 


CCT 


AAG 


GCT 


val leu 


cys 


asp 


cys 


arg 


ala 


OPA 


arg 


gly 


arg pro 


gin 


ser 


arg 


ser 


ser 


pro 


lys 


ala 


243/81 


















273/91 














ACC GTT 


CTG 


ACC 


TGG 


GGC 


TGC 


GTG 


GGC 


GCC 


GAC GAC 


GTG 


AGG 


CAC 


GTC 


ATG 


TCT 


CAG 


CGG 


thr val 


leu 


thr 


trp gly cys 


val 


gly 


ala 


asp asp 


val 


arg 


his 


val 


met 


ser 


gin 


arg 


303/101 


















333/111 














CCC ACC 


GCC 


ACC 


TCG 


GTC 


GCC 


GGC 


AGT 


ATG 


TCA GCA 


TGT 


GCA 


GAT 


GAC 


TCC 


ACG 


CAG 


CCT 


pro thr 


ala 


thr 


ser 


val 


ala 


gly 


ser 


met 


ser ala 


cys 


ala 


asp 


asp 


ser 


thr 


gin 


pro 


363/121 


















393/131 










TGT TCG 


CAT 


CGT 


TGG 


TGT 


CGT 


GGT 


TGC 


GAC 


GAC CTT 


GGC 


GCT 


GGT 


GAG 


CGC 


ACC 


CGC 


CGG 


cys ser 


his 


arg 


trp 


cys 


arg 


gly 


cys 


asp 


asp leu 


gly 


ala 


gly 


glu 


arg 


thr 


arg 


arg 



423/141 

CGG TCG TGC CGC GCA TGC GGA TC 
arg ser cys arg ala cys gly 

SEQ ID N° 10C 



FEUILLE DE REM^C^E^^REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



32/185 



CCC GAA GAG GTC CCC CGT TTT GTT AAT TTT 
pro glu glu val pro arg phe val asp phe 
61/21 

AAG GCA TAA AAC CTA GTA CCT GGG GCG GCG 
lys ala OCH asn leu val pro gly ala ala 
121/41 

GGG GCG TGC ATT CCG ACG ACC CTG TAC GAC 
gly ala cys ile pro thr thr leu tyr asp 
181/61 

ACG AAG GCC GAG CGA CGG GCT GCC GGC GCT 
thr lys ala glu arg arg ala ala gly ala 
241/81 

CAC CAC CGC CCG CAC CCG ACC GGT ACG GAT 
his his arg pro his pro thr gly thr asp 
301/101 

GCT GGA CAG CAT CGG TCC CCG CTG GGT CAA 
ala gly gin his arg ser pro leu gly gin 
361/121 

CAA CCC TTG AAC CGG GTC CCG GCC TGC CGA 
gin pro leu asn arg val pro ala cys arg 
421/141 

AGA CAC AGG GCC ATG GAA ATC CTG GCC AGC 
arg his arg ala met glu ile leu ala ser 
481/161 

CGG TCG CTG AGC TTC TAC CGT GAC CAG ATC 
arg ser leu ser phe tyr arg asp gin ile 



31/11 












TAA AAA 


ATT 


TGT 


GTC 


ACA 


AAC CGG GGT ACC 


OCH lys 


ile 


cys 


val 


thr 


lys arg gly thr 


91/31 












GAT TCA 


ACG 


AAA 


ACC 


GAG 


TGG GGG TAG TCA 


asp ser 


thr 


lys 


thr 


glu trp gly AMB ser 


151/51 












CCG CTG 


GTG 


GCA 


ACG 


CCG 


ATG AGT GCG CCG 


pro leu 


val 


ala 


thr 


pro 


met ser ala pro 


211/71 










GAC CGC 


CGC 


GGA 


AGC 


CGC 


CGA GTG CAT GGT 


asp arg 


arg 


gly 


ser 


arg 


arg val asp gly 


271/91 












CGC GCC 


TCG 


GGT 


TAC 


CGT 


CGC CGT CAA CGC 


arg ala 


ser 


gly 


tyr 


arg arg arg gin arg 


331/111 












TGC ACT 


CAT 


GCA 


GCG 


CCG 


CAA CGA ACA GCT 


cys thr 


his 


ala 


ala pro gin arg thr ala 


391/131 












CCC TCG 


GCC 


GCC 


GGC 


GTG 


CCG CTA CGT GAT 


pro ser 


ala 


ala 


gly val 


pro leu arg asp 


451/151 












CGG ATG 


CTA 


CTT 


CGG 


CCG 


GCG GAC TAT CAG 


arg met 


leu 


leu 


arg 


pro 


ala asp tyr gin 



SEQ ID N° 11A 



FIGURE 11A 



CCG AAG AGG TCC CCC GTT TTG TTA ATT TTT 
pro lys arg ser pro val leu leu ile phe 
62/21 

AGG CAT AAA ACC TAG TAC CTG GGG CGG CGG 
arg his lys thr AMB tyr leu gly arg arg 
122/41 

GGG CGT GCA TTC CGA CGA CCC TGT ACG ACC 
gly arg ala phe arg arg pro cys thr thr 
182/61 

CGA AGG CCG AGC GAC GGG CTG CCG GCG CTG 
arg arg pro ser asp gly leu pro ala leu 
242/81 

ACC ACC GCC CGC ACC CGA CCG GTA CGG ATC 
thr thr ala arg thr arg pro val arg ile 
302/101 

CTG GAC AGC ATC GGT CCC CGC TGG GTC AAT 
leu asp ser ile gly pro arg trp val asn 
362/121 

AAC CCT TGA ACC GGG TCC CGG CCT GCC GAC 
asn pro OPA thr gly ser arg pro ala asp 
422/141 

GAC ACA GGG CCA TGG AAA TCC TGG CCA GCC 
asp thr gly pro trp lys ser trp pro ala 
482/161 

GGT CGC TGA GCT TCT ACC GTG ACC AGA TC 
gly arg OPA ala ser thr val thr arg 



32/11 

AAA AAA TTT GTG TCA CAA AGC GGG GTA CCA 
lys lys phe val ser gin ser gly val pro 
92/31 

ATT CAA CGA AAA CCG AGT GGG GGT AGT CAG 
ile gin arg lys pro ser gly gly ser gin 
152/51 

CGC TGG TGG CAA CGC CGA TGA GTG CCC CGA 
arg trp trp gin arg arg OPA val arg arg 
212/71 

ACC GCC GCG GAA GCC GCC GAG TGG ATG GTC 
thr ala ala glu ala ala glu trp met val 
272/91 

GCG CCT CGG GTT ACC GTC GCC GTC ACC GCG 
ala pro arg val thr val ala val asn ala 
332/111 

GCA CTC ATG CAG CGC CGC AAC GAA CAG CTC 
ala leu met "gin arg arg asn glu gin leu 
392/131 

CCT CGG CCG CCG GCG TGC CGC TAC GTG ATA 
pro arg pro pro ala cys arg tyr val ile 
452/151 

GGA TGC TAC TTC GCC CGG CGG ACT ATC AGC 
gly cys tyr phe gly arg arg thr ile ser 



SEQ ID N° 11B 



FIGURE 11B 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



33/185 















33/11 


















CGA AGA 


GGT 


CCC 


CCG 


TTT TGT TAA TTT 


TTA 


AAA AAT 


TTG 




PAP 


AAA 


GCG 


GGG 


TAC 


CAA 


arg arg 


alv 


Dro 


pro phe cys OCH phe 


leu 


lys asn 


leu 


cys 


hi c 


xys 


ala 


gly tyr gin 


63/21 












93/31 


















GGC ATA 


AAA 


CCT 


AGT 


ACC TGG GGC* GGC 


GGA 


TTC AAC 


GAA 


AAC 


CGA 




GGG 


GTA 


ptp 
bit 


AGCj 


alv ile 


lvs 


Dro 








phe asn 


glu 




A rrr 

a, i. y 


Val 


gly val 


vai 


arg 


123/41 












153/51 














GGC GTG 


CAT 


TCC 




GAC CCT fSTA PftA 
vJ/W-. uin ^bn 


CCC 


GCT GGT 


GGC 


AAP 


GCC 


ftAT 






GCC 


GAC 


gly val 


hi s 


ser 


asp 


asp pro val arg 


pro 


ala gly gly 


asn 


aJ.a 


asp 


glu 


cys 


ala 


asp 


183/61 












213/71 














GAA GGC 


CGA 


GCG 


ACG 


GGC TGC CGG CGC 


TGA 


CCG CCG 


CGG 




PPP 




AGT 


GGA 


TGG 


TCA 




arg 


ala 


thr 


gly cys arg arg 


OPA 


pro pro 


arg 


lys 


pro 


pro 


ser 


gly 


trp 


ser 


?4 V81 












273/91 
















CCC 


GCA 


CCC 


GAC CGG TAC GGA 


TPG 


CGC CTC 


GGG 




ppp 




CCG 


TCA 


ACG 


CGC 


nro Tiro 


pro 


ala 


pro 


asp arg tyr gly 


ser 


arg leu 


gly 


leu 


pro 


ser 


pro 


ser 


tnr 


arg 


j \j J/ x w x 












333/111 














Tf;/; APA 


GCA 


TCG 


GTC 


CCC GCT GGG TCA 


ATf^ 


CAC TCA 


TGC 






(aCA 


ACG 


AAC 


AGC 


TCA 


trp thr 


ala 


ser 


val 


pro ala gly ser 


met 


his ser 


cys 


ser 


ala 


A 1 A 
ai ct 


thr 


asn 


ser 


ser 


363/121 












393/131 


















ACC CTT 


GAA 


CCG 


GGT 


CCC GGC CTG CCG 


ACC 


CTC GGC 


CGC 


CGG 


CGT 


GCC 


GCT 


ACG 


TGA 


TAG 


thr leu 


glu 


pro gly pro gly leu pro 


thr 


leu gly 


arg 


arg 


arg 


ala 


ala 


thr 


OPA 


AMB 


423/141 












453/151 


















ACA CAG 


GGC 


CAT 


GGA AAT CCT GGC CAG 


CCG 


GAT GCT 


ACT 


TCG 


GCC 


GGC 


GGA 


CTA 


TCA 


GCG 


thr gin 


gly 


his 


gly 


asn pro gly gin 


pro 


asp ala 


thr 


ser 


ala 


gly 


gly leu 


ser 


ala 


483/161 




























GTC GCT 


GAG 


CTT 


CTA 


CCG TGA CCA GAT 


C 




















val ala 


glu 


leu 


leu 


pro OPA pro asp 























SEQ ID N° 11C 
FIGURE 11C 



partie de la sequence nucleotidique de Seqll 



1/1 


















31/11 


















CGT CGC 


CGT 


CAA 


CGC 


GCT 


GGA 


CAG 


CAT 


CGG 


TCC CCG 


CTG 


GGT 


CAA 


TGC 


ACT 


CAT. 


GCA 


GCG 


arg arg 
61/21 


arg 


gin 


arg 


ala 


gly 


gin 


his 


arg 


ser pro 
91/31 


leu 


gly 


gin 


cys 


thr 


his 


ala 


ala 


CCG CAA 


CGA 


ACA 


GCT 


CAA 


CCC 


TTG 


AAC 


CGG 


GTC CCG 


GCC 


TGC 


CGA 


CCC 


TCG 


GCC 


GCC 


GGC 


pro gin 
121/41 


arg 


thr 


ala 


gin 


pro 


leu 


asn 


arg 


val pro 
151/51 


ala 


cys 


arg 


pro 


ser 


ala 


ala 


gly 


GTG CCG 


CTA 


CGT 


GAT 


AGA 


CAC 


AGG 


GCC 


ATG 


GAA ATC 


CTG 


GCC 


AGC 


CGG 


ATG 


CTA 


CTT 


CGG 


val pro 
181/61 


leu 


arg 


asp 


arg 


his 


arg 


ala 


met 


glu ile 
211/71 


leu 


ala 


ser 


arg 


met 


leu 


leu 


arg 


CCG GCG 


GAC 


TAT 


CAG 


CGG 


TCG 


CTG 


AGC 


TTC 


TAC CGT 


GAC 


CAG 


ATC 












pro ala 


asp 


tyr 


gin 


arg 


ser 


leu 


ser 


phe 


tyr arg 


asp 


gin 


ile 













SEQ ID N° 11A' 
FIGURE 11A» 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



34/185 



1/1 

GTC GCC GTC AAC GCG 
val ala val asn ala 
61/21 

CGC AAC GAA CAG CTC 
arg asn glu gin leu 
121/41 

TGC CGC TAC GTG ATA 
cys arg tyr val ile 
181/61 

CGG CGG ACT ATC AGC 
arg arg thr ile ser 



CTG GAC AGC ATC GGT 
leu asp ser ile gly 

AAC CCT TGA ACC GGG 
asn pro OPA thr gly 

GAC ACA GGG CCA TGG 
asp thr gly pro trp 

GGT CGC TGA GCT TCT 
gly arg OPA ala ser 



31/11 

CCC CGC TGG GTC AAT 
pro arg trp val asn 
91/31 

TCC CGG CCT GCC GAC 
ser arg pro ala asp 
151/51 

AAA TCC TGG CCA GCC 
lys ser trp pro ala 
211/71 

ACC GTG ACC AGA TC 
thr val thr arg 



GCA CTC ATG CAG CGC 
ala leu met gin arg 

CCT CGG CCG CCG GCG 
pro arg pro pro ala 

GGA TGC TAC TTC GGC 
gly cys tyr phe gly 



SEQ ID N° 11B' 



FIGURE 11B 1 



1/1 

TCG CCG TCA ACG CGC TGG ACA GCA TCG GTC 
ser pro ser thr arg trp thr ala ser val 
61/21 

GCA ACG AAC AGC TCA ACC CTT GAA CCG GGT 
ala thr asn ser ser thr leu glu pro gly 
121/41 

GCC GCT ACG TGA TAG ACA CAG GGC CAT GGA 
ala ala thr OPA AMB thr gin gly his gly 
181/61 

GGC GGA CTA TCA GCG GTC GCT GAG CTT CTA 
gly gly leu ser ala val ala glu leu leu 



31/11 

CCC GCT GGG TCA ATG CAC TCA TGC AGC GCC 
pro ala gly ser met his ser cys ser ala 
91/31 

CCC GGC CTG CCG ACC CTC GGC CGC CGG CGT 
pro gly leu pro thr leu gly arg arg arg 
151/51 

AAT CCT GGC CAG CCG GAT GCT ACT TCG GCC 
asn pro gly gin pro asp ala thr ser ala 
211/71 

CCG TGA CCA GAT C 
pro OPA pro asp 



SEQ ID N° 11C 



FIGURE 11C 



sequence Rv0546c predite par par Cole et al. (Nature 393:537-544) et contenant SeqllA* 
1/1 31/11 

atg gaa ate ctg gec age egg atg eta ctt egg ccg gcg gac tat cag egg teg ctg age 
Met glu ile leu ala ser arg met leu leu arg pro ala asp tyr gin arg ser leu ser 
61/21 91/31 

ttc tac cgt gac cag ate ggg ctg gcg att gec cgt gaa tac ggg gec ggc aca gtg ttt 
phe tyr arg asp gin ile gly leu ala ile ala arg glu tyr gly ala gly thr val phe 
121/41 151/51 

ttc gec ggt cag tea ctg etc gaa ctg gec ggt tac ggc gag ccg gac cat teg egg gga 
phe ala gly gin ser leu leu glu leu ala gly tyr gly glu pro asp his ser arg gly 
181/61 211/71 

cct ttt ccc ggc gcg ctg tgg ctg cag gtg cgc gac etc gag get acc cag acc gag ctg 
pro phe pro gly ala leu trp leu gin val arg asp leu glu ala thr gin thr glu leu 
241/81 271/91 

gtc age cga ggc gtg teg ate get cgc gag ccc cgc cgc gaa ccg tgg ggc ctg cac gag 
val ser arg gly val ser ile ala arg glu pro arg arg glu pro trp gly leu his glu 
301/101 331/111 

atg cat gtg acc gac cca gac ggg ate aca ctg ata ttc gtc gag gtt ccc gag ggt cac 
met his val thr asp pro asp gly ile thr leu ile phe val glu val pro glu gly his 
361/121 

ccg ctg cgt aca gac acc egg gcg tga 
pro leu arg thr asp thr arg ala OPA 

SEQ ID N° 11D 



FEUILLE DE REMftzft^Ei^REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



35/185 



ORF predite par par Cole et 
1/1 

tag tea ggg cgt gca ttc gac 
AMB ser gly arg ala phe asp 
61/21 

gec gac gaa ggc eta cga egg 
ala asp glu gly leu arg arg 
121/41 

ggt cac cgc cgc ccg cac ccg 
gly his arg arg pro his pro 
181/61 

cgc get gga cag cat egg tec 
arg ala gly gin his arg ser 
241/81 

get caa ccc ttg aac egg gtc 
ala gin pro leu asn arg val 
301/101 

gat aga cac agg gee atg gaa 
asp arg his arg ala met glu 
361/121 

cag egg teg ctg age ttc tac 
gin arg ser leu ser phe tyr 
421/141 

gee ggc aca gtg ttt ttc gee 
ala gly thr val phe phe ala 
481/161 

gac cat teg egg gga cct ttt 
asp his ser arg gly pro phe 
541/181 

ace cag ace gag ctg gtc age 
thr gin thr glu leu val ser 
601/201 

tgg ggc ctg cac gag atg cat 
trp gly leu his glu met his 
661/221 

gtt ccc gag ggt cac ccg ctg 
val pro glu gly his pro leu 



al. (Nature 393:537-544) 
31/11 

gac get gta eta ccc get 
asp ala val leu pro ala 
91/31 

get gee ggc get gac cgc 
ala ala gly ala asp arg 
151/51 

ace ggt gcg gat cgc gee 
thr gly ala asp arg ala 

211/71 
ccg ctg ggt caa tgc act 
pro leu gly gin cys thr 

271/91 
ccg gec tgc cga ccc teg 
pro ala cys arg pro ser 

331/111 
ate ctg gec age egg atg 
ile leu ala ser arg met 

391/131 
cgt gac cag ate ggg ctg 
arg asp gin ile gly leu 

451/151 
ggt cag tea ctg etc gaa 
gly gin ser leu leu glu 

511/171 
ccc ggc gcg ctg tgg ctg 
pro gly ala leu trp leu 

571/191 
cga ggc gtg teg ate get 
arg gly val ser ile ala 

631/211 
gtg ace gac cca gac ggg 
val thr asp pro asp gly 

691/231 
cgt aca gac ace egg gcg 
arg thr asp thr arg ala 



SEQ ID N° 11F 
FIGURE 11F 



et contenant Rv0546c 



ggt ggc aac tec gat gat tgc 
gly gly asn ser asp asp cys 

cgc gga age cgc cga gtg gat 
arg gly ser arg arg val asp 

teg ggt tgc cgt cgc cgt caa 
ser gly cys arg arg arg gin 

cat gca gcg ccg caa cga aca 
his ala ala pro gin arg thr 

gec gee ggc gtg ccg eta cgt 
ala ala gly val pro leu arg 

eta ctt egg ccg gcg gac tat 
leu leu arg pro ala asp tyr 

gcg att gee cgt gaa tac ggg 
ala ile ala arg glu tyr gly 

ctg gee ggt tac ggc gag ccg 
leu ala gly tyr gly glu pro 

cag gtg cgc gac etc gag get 
gin val arg asp leu glu ala 

cgc gag ccc cgc cgc gaa ccg 
arg glu pro arg arg glu pro 

ate aca ctg ata ttc gtc gag 
ile thr leu ile phe val glu 

tga 
OPA 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



36/185 



PCT/FR98/01813 



1/1 

gac cga agg gat 
asp arg arg asp 
61/21 

gac gta gac agg 
asp val asp arg 
121/41 

gag tct ttc cga 
glu ser phe arg 
181/61 

gcg gcc egg gec 
ala ala arg ala 
241/81 

gac aac cgc gcg 
asp asn arg ala 
301/101 

aac etc egg agt 
asn leu arg ser 



ttc gcg act aac 
phe ala thr asn 

aag aga cag gga 
lys arg gin gly 

gtt cag caa caa 
val gin gin gin 

get teg ggc cga 
ala ser gly arg 

gaa ttc aat egg 
glu phe asn arg 

gat c 
asp 



31/11 
teg gcc tgt aag 
ser ala cys lys 

91/31 
age tga tga cgt 
ser OPA OPA arg 

151/51 
teg aca cag aag 
ser thr gin lys 

211/71 
gtg tct gag taa 
val ser glu OCH 

271/91 
atg gcg ggc ggg 
met ala gly gly 



gca acg cga ggt 
ala thr arg gly 

cgc gta ccg gac 
arg val pro asp 

egg gga cca gac 
arg gly pro asp 

gac cag agt cac 
asp gin ser his 

acc gga ttg cgc 
thr gly leu arg 



ctt cat gcc gag 
leu his ala glu 

cgc cat tct gtc 
arg his ser val 

egg gag gac gac 
arg glu asp asp 

ggg tec gtg tgt 
gly ser val cys 

egg tea ccg agg 
arg ser pro arg 



SEQ ID N° 12A 



FIGURE 12A 



1/1 

acc gaa ggg att teg cga eta act egg cct 
thr glu gly ile ser arg leu thr arg pro 
61/21 

acg tag aca gga aga gac agg gaa get gat 
thr AMB thr gly arg asp arg glu ala asp 
121/41 

agt ctt tec gag ttc. age aac aat cga cac 
ser leu ser glu phe ser asn asn arg his 
181/61 

egg ccc ggg ccg ctt egg gcc gag tgt ctg 
arg pro gly pro leu arg ala glu cys leu 
241/81 

aca acc gcg egg aat tea ate gga tgg egg 
thr thr ala arg asn ser ile gly trp arg 
301/101 

acc tec gga gtg ate 
thr ser gly val ile 



31/11 

gta agg caa cgc gag gtc ttc atg ccg agg 
val arg gin arg glu val phe met pro arg 
91/31 

gac gtc gcg tac egg acc gcc att ctg teg 
asp val ala tyr arg thr ala ile leu ser 
151/51 

aga age ggg gac cag acc ggg agg acg acg 
arg ser gly asp gin thr gly arg thr thr 
211/71 

agt aag acc aga gtc acg ggt ccg tgt gtg 
ser lys thr arg val thr gly pro cys val 
271/91 

gcg gga ccg gat tgc gcc ggt cac cga gga 
ala gly pro asp cys ala gly his arg gly 



SEQ ID N° 12B 



FIGURE 12B 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



37/185 



l/l 

ccg aag gga ttt 
pro lys gly phe 
61/21 

cgt aga cag gaa 
arg arg gin glu 
121/41 

gtc ttt ccg agt 
val phe pro ser 
181/61 

ggc ccg ggc cgc 
gly pro gly arg 
241/81 

caa ccg cgc gga 
gin pro arg gly 
301/101 

cct ccg gag tga 
pro pro glu OPA 



cgc gac taa etc 
arg asp OCH leu 

gag aca ggg aag 
glu thr gly lys 

tea gca aca ate 
ser ala thr ile 

ttc ggg ccg agt 
phe gly pro ser 

att caa teg gat 
ile gin ser asp 

tc 



31/11 
ggc ctg taa ggc 
gly leu OCH gly 

91/31 
ctg atg acg teg 
leu met thr ser 

151/51 
gac aca gaa gcg 
asp thr glu ala 

211/71 
gtc tga gta aga 
val OPA val arg 

271/91 
ggc ggg egg gac 
gly gly arg asp 



SEQ ID N 



aac gcg agg tct 
asn ala arg ser 

cgt acc gga ccg 
arg thr gly pro 

ggg acc aga ccg 
gly thr arg pro 

cca gag tea egg 
pro glu ser arg 

egg att gcg ccg 
arg ile ala pro 



12C 



tea tgc cga gga 
ser cys arg gly 

cca ttc tgt cga 
pro phe cys arg 

gga gga cga cgc 
gly gly arg arg 

gtc cgt gtg tga 
val arg val OPA 

gtc acc gag gaa 
val thr glu glu 



FIGURE 12C 



1/1 

GGG ATT TCG TTG CCC GAT GGA TTG TTT GTA 
gly ile ser leu pro asp gly leu phe val 
61/21 

TAT TGG CAA TGC TGG AAA TGG ACA TTC CAA 
tyr trp gin cys trp lys trp thr phe gin 
121/41 

GGG GGG CAA GCG TTT GTA CCG GGG CCA GCA 
gly gly gin ala phe val pro gly pro ala 
181/61 

ATG TTG TTG TGT CAG CGC GGG CTT GGT CTC 
met leu leu cys gin arg gly leu gly leu 
241/81 

TCA AAA CAG GTT GAA CTT AAC GAC TCA AGA 
ser lys gin val glu leu asn asp ser arg 
301/101 

GGA CAC CAA TTT GAC TCG GCT CTT TGG CAA 
gly his gin phe asp ser ala leu trp gin 
361/121 

CGC ATC GTT GGC CTT GCC ATC AAT CGC CGG 
arg ile val gly leu ala ile asn arg arg 
421/141 

GGG ACC GAC CTC GAC CAG GGG TCC TTT GTG 
gly thr asp leu asp gin gly ser phe val 
481/161 

GTC GGT CAT CGC CTA AGG CTA CCG TTC TGA 
val gly his arg leu arg leu pro phe OPA 
541/181 

GGC ACG TCA TGT CTC AGC GGC CCA CCG CCA 
gly thr ser cys leu ser gly pro pro pro 
601/201 

CAG ATG ACT CCA CGC AGC CTT GTT CGC ATC 
gin met thr pro arg ser leu val arg ile 
661/221 

CTG GTG AGC GCA CCC GCC GGC GGT CGT GCC 
leu val ser ala pro ala gly gly arg ala 



31/11 

CGG TTT GGG AAA AAC ACT TGA AGT CCT TTT 
arg phe gly lys asn thr OPA ser pro phe 
91/31 

TAT TGC GCG AAT TAA CCG AAC ACG GTG AGG 
tyr cys ala asn OCH pro asn thr val arg 
151/51 

AGC GCC GCC GAC CGG TTG ACC GAA GCC AGC 
ser ala ala asp arg leu thr glu ala ser 
211/71 

GAT GTC CCG GCC TTG GCT GGA CCC GCT TCT 
asp val pro ala leu ala gly pro ala ser 
271/91 

ACG GAA ACG CTT GAA CCG CGA CGT CGC TCC 
thr glu thr leu glu pro arg arg arg ser 
331/111 

TTG AAG GTG AGC TGC GAG CAG CCG GGT GAC 
leu lys val ser cys glu gin pro gly asp 
391/131 

CTC GCG GAC GTA GAT AAT CAG CTC ACC GTT 
leu ala asp val asp asn gin leu thr val 
451/151 

ACT GCC GGG CTT GAC GCG GAC GAC CAC AGA 
thr ala gly leu asp ala asp asp his arg 
511/171 

CCT GGG GCT GCG TGG GCG CCG ACG ACG TGA 
pro gly ala ala trp ala pro thr thr OPA 
571/191 

CCT CGG TCG CCG GCA GTA TGT CAG CAT GTG 
pro arg ser oro ala val cys gin his val 
631/211 

GTT GGT GTC GTG GTT GCG ACG ACC TTG GCG 
val gly val val val ala thr thr leu ala 
691/231 

GCG CAT GCG GAT C 
ala his ala asp 



SEQ ID N° 13A 



FIGURE 13A 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



38/185 



GGA TTT CGT TGC CCG ATG GAT 
gly phe arg cys pro met asp 
62/21 

ATT GGC AAT GCT GGA AAT GGA 
ile gly asn ala gly asn gly 
122/41 

GGG GGC AAG CGT TTG TAC CGG 
gly gly lys arg leu tyr arg 
182/61 

TGT TGT TGT GTC AGC GCG GGC 
cys cys cys val ser ala gly 
242/81 

CAA AAC AGG TTG AAC TTA ACG 
gin asn arg leu asn leu thr 
302/101 

GAC ACC AAT TTG ACT CGG CTC 
asp thr asn leu thr arg leu 
362/121 

GCA TCG TTG GCC TTG CCA TCA 
ala ser leu ala leu pro ser 
422/141 

GGA CCG ACC TCG ACC AGG GGT 
gly pro thr ser thr arg gly 
482/161 

TCG GTC ATC GCC TAA GGC TAC 
ser val ile ala OCH gly tyr 
542/181 

GCA CGT CAT GTC TCA GCG GCC 
ala arg his val ser ala ala 
602/201 

AGA TGA CTC CAC GCA GCC TTG 
arg OPA leu his ala ala leu 
662/221 

TGG TGA GCG CAC CCG CCG GCG 
trp OPA ala his pro pro ala 



32/11 

TGT TTG TAC GGT TTG GGA 
cys leu tyr gly leu gly 
92/31 

CAT TCC AAT ATT GCG CGA 
his ser asn ile ala arg 
152/51 

GGC CAG CAA GCG CCG CCG 
gly gin gin ala pro pro 

212/71 
TTG GTC TCG ATG TCC CGG 
leu val ser met ser arg 

272/91 
ACT CAA GAA CGG AAA CGC 
thr gin glu arg lys arg 

332/111 
TTT GGC AAT TGA AGG TGA 
phe gly asn OPA arg OPA 

392/131 
ATC GCC GGC TCG CGG ACG 
ile ala gly ser arg thr 

452/151 
CCT TTG TGA CTG CCG GGC 
pro leu OPA leu pro gly 

512/171 
CGT TCT GAC CTG GGG CTG 
arg ser asp leu gly leu 

572/191 
CAC CGC CAC CTC GGT CGC 
his arg his leu gly arg 

632/211 
TTC GCA TCG TTG GTG TCG 
phe ala ser leu val ser 

692/231 
GTC GTG CCG CGC ATG CGG 
val val pro arg met arg 

SEQ ID N° 13B 
FIGURE 13B 



AAA ACA CTT GAA GTC CTT TTT 
lys thr leu glu val leu phe 

ATT AAC CGA ACA CGG TGA GGG 
ile asn arg thr arg OPA gly 

ACC GGT TGA CCG AAG CCA GCA 
thr gly OPA pro lys pro ala 

CCT TGG CTG GAC CCG CTT CTT 
pro trp leu asp pro leu leu 

TTG AAC CGC GAC GTC GCT CCG 
leu asn arg asp val ala pro 

GCT GCG AGC AGC CGG GTG ACC 
ala ala ser ser arg val thr 

TAG ATA ATC AGC TCA CCG TTG 
AMB ile ile ser ser pro leu 

TTG ACG CGG ACG ACC ACA GAG 
leu thr arg thr thr thr glu 

CGT GGG CGC CGA CGA CGT GAG 
arg gly arg arg arg arg glu 

CGG CAG TAT GTC AGC ATG TGC 
arg gin tyr val ser met cys 

TGG TTG CGA CGA CCT TGG CGC 
trp leu arg arg pro trp arg 

ATC 
ile 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



39/185 



33/11 

GAT TTC GTT GCC CGA TGG ATT GTT TGT ACG GTT TGG GAA AAA CAC TTG AAG TCC TTT TTA 
asp phe val ala arg trp ile val cys thr val trp glu lys his leu lys ser phe leu 
63/21 93/31 

TTG GCA ATG CTG GAA ATG GAC ATT CCA ATA TTG CGC GAA TTA ACC GAA CAC GGT GAG GGG 
leu ala met leu glu met asp ile pro ile leu arg glu leu thr glu his gly glu gly 
123/41 153/51 

GGG GCA AGC GTT TGT ACC GGG GCC AGC AAG CGC CGC CGA CCG GTT GAC CGA AGC CAG CAT 
gly ala ser val cys thr gly ala ser lys arg arg arg pro val asp arg ser gin his 
183/61 213/71 

GTT GTT GTG TCA GCG CGG GCT TGG TCT CGA TGT CCC GGC CTT GGC TGG ACC CGC TTC TTC 
val val val ser ala arg ala trp ser arg cys pro gly leu gly trp thr arg phe phe 
243/81 273/91 

AAA ACA GGT TGA ACT TAA CGA CTC AAG AAC GGA AAC GCT TGA ACC GCG ACG TCG CTC CGG 
lys thr gly OPA thr OCH arg leu lys asn gly asn ala OPA thr ala thr ser leu arg 
303/101 333/111 

ACA CCA ATT TGA CTC GGC TCT TTG GCA ATT GAA GGT GAG CTG CGA GCA GCC GGG TGA CCG 
thr pro ile OPA leu gly ser leu ala ile glu gly glu leu arg ala ala gly OPA pro 
363/121 393/131 

CAT CGT TGG CCT TGC CAT CAA TCG CCG GCT CGC GGA CGT AGA TAA TCA GCT CAC CGT TGG 
his arg trp pro cys his gin ser pro ala arg gly arg arg OCH ser ala his arg trp 
423/141 453/151 

GAC CGA CCT CGA CCA GGG GTC CTT TGT GAC TGC CGG GCT TGA CGC GGA CGA CCA CAG AGT 
asp arg pro arg pro gly val leu cys asp cys arg ala OPA arg gly arg pro gin ser 
483/161 513/171 

CGG TCA TCG CCT AAG GCT ACC GTT CTG ACC TGG GGC TGC GTG GGC GCC GAC GAC GTG AGG 
arg ser ser pro lys ala thr val leu thr trp gly cys val gly ala asp asp val arg 
543/181 . 573/191 

CAC GTC ATG TCT CAG CGG CCC ACC GCC ACC TCG GTC GCC GGC AGT ATG TCA GCA TGT GCA 
his val met ser gin arg pro thr ala thr ser val ala gly ser met ser ala cys ala 
603/201 633/211 

GAT GAC TCC ACG CAG CCT TGT TCG CAT CGT TGG TGT CGT GGT TGC GAC GAC CTT GGC GCT 

asp asp ser thr gin pro cys ser his arg trp cys arg gly cys asp asp leu gly ala 

663/221 693/231 

GGT GAG CGC ACC CGC CGG CGG TCG TGC CGC GCA TGC GGA TC 

gly glu arg thr arg arg arg ser cys arg ala cys gly 



SEQ ID N° 13C 
FIGURE 13C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



40/185 



partie de la sequence nucleotidique de seql3A 
1/1 31/11 

GGG TCC TTT GTG ACT GCC GGG CTT GAC GCG GAC GAC CAC AGA GTC GGT CAT CGC CTA AGG 
gly ser phe val thr ala gly leu asp ala asp asp his arg val gly his arg leu arg 
61/21 91/31 

CTA CCG TTC TGA CCT GGG GCT GCG TGG GCG CCG ACG ACG TGA GGC ACG TCA TGT CTC AGC 
leu pro phe OPA pro gly ala ala trp ala pro thr thr OPA gly thr ser cys leu ser 
121/41 151/S1 

GGC CCA CCG CCA CCT CGG TCG CCG GCA GTA TGT CAG CAT GTG CAG ATG ACT CCA CGC AGC 
gly pro pro pro pro arg ser pro ala val cys gin his val gin met thr pro arg ser 
181/61 211/71 

CTT GTT CGC ATC GTT GGT GTC GTG GTT GCG ACG ACC TTG GCG CTG GTG AGC GCA CCC GCC 
leu val arg ile val gly val val val ala thr thr leu ala leu val ser ala pro ala 
241/81 

GGC GGT CGT GCC GCG CAT GCG GAT C 
gly gly arg ala ala his ala asp 



SEQ ID N° 13A' 
FIGURE 13A" 



1/1 31/11 

GGT CCT TTG TGA CTG CCG GGC TTG ACG CGG ACG ACC ACA GAG TCG GTC ATC GCC TAA GGC 
gly pro leu OPA leu pro gly leu thr arg thr thr thr glu ser val ile ala OCH gly 
61/21 91/31 

TAC CGT TCT GAC CTG GGG CTG CGT GGG CGC CGA CGA CGT GAG GCA CGT CAT GTC TCA GCG 
tyr arg ser asp leu gly leu arg gly arg arg arg arg glu ala arg his val ser ala 
121/41 151/51 

GCC CAC CGC CAC CTC GGT CGC CGG CAG TAT GTC AGC ATG TGC AGA TGA CTC CAC GCA GCC 
ala his arg his leu gly arg arg gin tyr val ser met cys arg OPA leu his ala ala 
181/61 211/71 

TTG TTC GCA TCG TTG GTG TCG TGG TTG CGA CGA CCT TGG CGC TGG TGA GCG CAC CCG CCG 
leu phe ala ser leu val ser trp leu arg arg pro tro arg trp OPA ala his pro pro 
241/81 

GCG GTC GTG CCG CGC ATG CGG ATC 
ala val val pro arg met arg ile 



SEQ ID N° 13B' 
FIGURE 13B' 



1/1 


















31/11 














GTC CTT 


TGT 


GAC 


TGC 


CGG 


GCT 


TGA 


CGC 


GGA 


CGA CCA 


CAG 


AGT 


CGG 


TCA 


TCG 


CCT AAG GCT 


val leu 


cys 


asp 


cys 


arg 


ala 


OPA 


arg 


gly 


arg pro 


gin 


ser 


arg 


ser 


ser 


pro lys ala 


61/21 


















91/31 










ACC GTT 


CTG 


ACC 


TGG 


GGC 


TGC 


GTG 


GGC 


GCC 


GAC GAC 


GTG 


AGG 


CAC 


GTC 


ATG 


TCT CAG CGG 


thr val 


leu 


thr 


trp gly 


cys 


val 


gly 


ala 


asp asp 


val 


arg 


his 


val 


met 


ser gin arg 


121/41 


















151/51 












CCC ACC 


GCC 


ACC 


TCG 


GTC 


GCC 


GGC 


AGT 


ATG 


TCA GCA 


TGT 


GCA 


GAT 


GAC 


TCC 


ACG CAG CCT 


pro thr 


ala 


thr 


ser 


val 


ala 


gly 


ser 


met 


ser ala 


cys 


ala 


asp 


asp 


ser 


thr gin pro 


181/61 


















211/71 












TGT TCG 


CAT 


CGT 


TGG 


TGT 


CGT 


GGT 


TGC 


GAC 


GAC CTT 


GGC 


GCT 


GGT 


GAG 


CGC 


ACC CGC CGG 


cys ser 


his 


arg 


trp 


cys 


arg 


gly 


cys 


asp 


asp leu 


gly 


ala gly glu arg 


thr arg arg 


241/81 
































CGG TCG 


TGC 


CGC 


GCA 


TGC 


GGA 


TC 




















arg ser 


cys 


arg 


ala 


cys 


gly 























SEQ ID N° 13C 

FIGURE 13C 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



41/185 



sequence Rvl984c predite par. Cole et al . (Nature 393:537-544) et contenant 
seql3A' 

1/1 31/11 



atg act, 


cca 


cgc 


age 




gec 


cgc 


ate 


gCC 


*m ft ^ ft ^ n 

ggc gee 


gtg 


_ f. f. 

gtc 


gcg 


acg 


acc 


ttg 


gcg 


ctg 


Mat- -hVir 


pro 


a rg 


ser 


leu 


Vdl 


arg 


ile 


Vfll 


gly val 


vax 


vax 


aia 


thr 


thr 


leu 


ala 


1 All 

leu 


Ul/ £. J. 


















71/ Jl 


















gtg age 


gca 


ccc 


gee 


ggc 


ggt 


cgt 


gee 


gcg 


cat gcg 


gat 


ccg 


tgt 


teg 


gac 


ate 


gcg 


gtc 


val ser 


ala 


pro 


ala 


gly 


gly 


arg 


ala 


aia 


his ala 


asp 


pro 


cys 


ser 


asp 


ile 


ala 


val 


121/41 


















ID ±/ Jj. 
















gtt ttc 


get 


cgc 


ggc 


acg 


cat 


cag 


get 


tct 


ggt ctt 


ggc 


gac 


gtc 


ggt 


gag 


gcg 


ttc 


gtc 


val phe 


ala 


arg 


gly 


enr 


his 


gin ala 


ser 


gly leu 


gly 


asp 


vai 


gly glu 


ala phe 


val 


181/61 


















£. X -L / / JL 


















gac teg 


ctt 


acc 


teg 


caa 


gtt 


ggc 


ggg 


egg 


tcy act. 


ggg 


gtc 


cac 


gcg 


gtg 


aac 


tac 


cca 


asp ser 


leu 


thr 


ser 


gin 


val 


gly gly 


arg 


s er ile 


giy 


vax 


tyr 


ala 


val 


asn 


tyr 


pro 


241/81 


















71 1 / Q 1 

C / X / .7 X 


















gca age 


gac 


gac 


tac 


cgc 


gcg 


age 


gcg 




aac ggt 


tec 


gat 


gat 


gcg 


age 


gec 


cac 


ate 


ala ser 


asp 


asp 


tyr 


arg 


ala 


ser 


ala 


ser 


asn gly 


ser 


asp 


asp 


ala 


ser 


ala 


his 


ile 


301/101 


















JJl/ X JL X 


















cag cgc 


acc 


gtc 


gec 


age 


tgc 


ccg 


aac 


a cc 


agg att 


gtg 


ccc 


ggt 


ggc 


tat 


teg 


cag 


ggt 


gin arg thr 


val 


ala 


ser 


cys 


pro 


asn 


cur 


arg ile 


if a 1 

vax 


leu 


gly 


giy tyr 


ser 


gin 


giy 


361/121 


















1 / I "11 
JJl/ X Jl 


















gcg acg 


gtc 


ate 


gat 


tta 


tec 


acc 


teg 


Cf CO 
y uy 




cec 


gcg 


rt t* ft 
gcg 


gca 


gat 


cat 


gtc 


gec 


ala thr 


val 


ile 


asp 


leu 


ser 


thr 


ser 


ala 


met pro 


pro 


ala 


val 


ala 


asp 


his 


val 


ala 


421/141 


















451/151 
















get gtc 


gee 


ctt 


ttc 


ggc 


gag 


cca 


tec 


agt 


ggt ttc 


tec 


age 


atg 


ttg 


tgg 


ggc 


ggc 


ggg 


ala val 


ala 


leu phe 


gly 


glu pro 


ser 


ser 


gly phe 


ser 


ser 


met 


leu 


trp 


gly gly 


gly 


481/161 


















511/171 


















teg ttg 


ccg 


aca 


ate 


ggt 


ccg 


ctg 


tat 


age 


tct aag 


acc 


ata 


aac 


ttg 


tgt 


get 


ccc 


gac 


ser leu 


pro 


thr 


ile 


gly 


pro 


leu 


tyr 


ser 


ser lys 


thr 


ile 


asn 


leu 


cys 


ala 


pro 


asp 


541/181 


















571/191 
















gat cca 


ata 


tgc 


acc 


gga 


ggc 


ggc 


aat 


att 


atg gcg 


cat 


gtt 


teg 


tat 


gtt 


cag 


teg 


ggg 


asp pro 


ile 


cys 


thr 


gly 


gly gly 


asn 


ile 


met ala 


his 


val 


ser 


tyr 


val 


gin 


ser 


gly 


601/201 


















631/211 


















atg aca 


age 


cag 


gcg 


gcg 


aca 


ttc 


gcg 


gcg 


aac agg 


etc 


gat 


cac 


gec 


gga 


tga 






met thr 


ser 


gin ala 


ala 


thr phe 


ala 


ala 


asn arg 


leu 


asp 


his 


ala 


gly 


OPA 







SEQ ID N° 13D 
FIGURE 13D 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



42/185 



PCT/FR98/01813 



Seql3F: 


ORF 


predite 


par 


Cole et 


al. 


(Nature 393: 


537- 


■544) 


et 


contenant Rvl984c 


1/1 


















31/11 


















tga ggc 
OPA gly 
61/21 


acg 
thr 


tea 
ser 


tgt 
cys 


etc 
leu 


age 
ser 


ggc 
gly 


cca 
pro 


ccg 
pro 


cca cct 
pro pro 
91/31 


egg 
arg 


teg 
ser 


ccg 
pro 


gca 
ala 


gta 
val 


tgt 
cys 


cag cat 
gin his 


gtg cag atg 
val gin met 
121/41 


act 
thr 


cca 
pro 


cgc 
arg 


age 
ser 


ctt 
leu 


gtt 
val 


cgc 
arg 


ate gtt 
ile val 
151/51 


ggt gtc 
gly val 


gtg 
val 


gtt 
val 


gcg 
ala 


acg 
thr 


acc 
thr 


ttg 
leu 


gcg ctg 
ala leu 
181/61 


gtg 
val 


age 
ser 


gca 
ala 


ccc 
pro 


gec 
ala 


ggc 
gly 


ggt cgt 
gly arg 


gec gcg 
ala ala 
211/71 


cat 
his 


gcg 
ala 


gat 
asp 


ccg 
pro 


tgt 
cys 


teg 
ser 


gac 
asp 


ate 

ile 


gcg gtc 
ala val 
241/81 


gtt 
val 


ttc 
phe 


get 
ala 


cgc ggc 
arg gly 


acg 
thr 


cat 
his 


cag 
gin 


get tct 
ala ser 
271/91 


ggt ctt 
gly leu 


ggc 
gly 


gac 
asp 


gtc 
val 


ggt 
gly 


gag 
glu 


gcg 
ala 


ttc gtc 
phe val 
301/101 


gac 
asp 


teg 
ser 


ctt 
leu 


acc 
thr 


teg 
ser 


caa 
gin 


gtt 
val 


ggc 
gly 


ggg egg 
gly arg 
331/111 


teg 
ser 


att 
ile 


ggg 

gly 


gtc 
val 


tac 
tyr 


gcg 
ala 


gtg 
val 


aac 
asn 


tac cca 
tyr pro 
361/121 


gca 
ala 


age 
ser 


gac 
asp 


gac 
asp 


tac 
tyr 


cgc 
arg 


gcg 
ala 


age 
ser 


gcg tea 
ala ser 
391/131 


aac 
asn 


ggt 
gly 


tec 
ser 


gat 
asp 


gat 
asp 


gcg 
ala 


age 
ser 


gec 
ala 


cac ate 
his ile 
421/141 


cag 
gin 


cgc 
arg 


ace 
thr 


gtc 
val 


gec 
ala 


age 
ser 


tgc 
cys 


ccg 
pro 


aac acc 
asn thr 
451/151 


agg 
arg 


att 
ile 


gtg 
val 


ctt 
leu 


ggt 
gly 


ggc 
gly 


tat 
tyr 


teg 
ser 


cag ggt gcg 
gin gly ala 
481/161 


acg 
thr 


gtc 
val 


ate 
ile 


gat 
asp 


ttg 
leu 


tec 
ser 


acc 
thr 


teg gcg 
ser ala 
511/171 


atg 
met 


ccg 
pro 


ccc 
pro 


gcg 
ala 


gtg 
val 


gca 
ala 


gat 
asp 


cat 

his 


gtc gec 
val ala 
541/181 


get 
ala 


gtc 
val 


gec 
ala 


ctt ttc 
leu phe 


ggc 
gly 


gag cca 
glu pro 


tec agt 
ser ser 
571/191 


ggt ttc 
gly phe 


tec 
ser 


age 
ser 


atg 
met 


ttg 
leu 


tgg 
trp 


ggc 
gly 


ggc ggg 
gly gly 
601/201 


teg 
ser 


ttg 
■leu 


ccg 
pro 


aca 
thr 


ate 
ile 


ggt 
gly 


ccg 
pro 


ctg 
leu 


tat age 
tyr ser 
631/211 


tct 
ser 


aag 
lys 


acc 
thr 


ata 
ile 


aac 
asn 


ttg 
leu 


tgt 
cys 


get 
ala 


ccc gac 
pro asp 
661/221 


gat 
asp 


cca 
pro 


ata 
ile 


tgc 
cys 


acc 
thr 


gga 
gly 


ggc ggc 
gly gly 


aat att 
asn ile 
691/231 


atg 
met 


gcg 
ala 


cat 
his 


gtt 
val 


teg 
ser 


tat 
tyr 


gtt 
val 


cag 
gin 


teg ggg atg 
ser gly met 


aca 
thr 


age 
ser 


cag gcg 
gin ala 


gcg 
ala 


aca ttc 
thr phe 


gcg gcg 
ala ala 


aac 
asn 


agg 
arg 


etc 
leu 


gat 
asp 


cac 
his 


gee 
ala 


gga tga 
gly OPA 



SEQ ID N° 13F 
FIGURE 13F 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



43/185 



31/11 



ccTi ccc ccc cvc 
CCA Itb GGG C1G 


C^C CCC CCTK 

GAG GGG CGA 


ATG 


TGC 


ccc 

GCC 


CTl a ccc 

GAA CGC 


CGT 


CGG 


CCA ACT 


TGG 


CCG 


CTG 


AGG 


pro pro gly leu 


glu gly arg 


met 


cys 


ala 


glu arg 


arg 


arg 


pro 


thr 


trp 


pro 


leu 


arg 


01/21 










91/31 












CCC CCH* a rp CCC 

GCG GC1 Vj/\1 LLL 


cn^c ccc cc k 
C1G GCC CGA 


GAC 


GGG 


ecu 
GCA 


AGC CAA 


TAG 


CGG 


CTC 


CAT 


CGG 


GCT 


TTG 


CTG 


ala ala asp pro 


leu ala arg 


asp gly 


ala 


ser gin 


AMB 


arg 


leu 


his 


arg 


ala 


leu 


leu 


121/ 41 










151/51 














rm* ccc /"Tnt ccc 

GTA GCG GT1 CGG 


ccc C T\ 1\ CCC 

CGG GAA CCG 


AGC 


GCC 


GAC 


emm MniA 

GTT GTC 


GGT 


GCC 




TGA 


TAT 


ATT 


GGG 


TCA 


val ala val arg 


arcr olu oro 


ser 


ala 


asp 


val val 


gly ala 


arg 


OPA 


tyr 


ile 


gly 


ser 


181/61 










211/71 














GAC GGG TAT GGC 


GGC GAC TGA 


GGT 


GAT 


CTG 


CGA CAC 


GCC 


GCC 


GCG 


GTG 


CTC 


GAG 


CCA 


GGC 


asp gly tyr gly 


gly asp OPA 


gly asp 


leu 


arg his 


ala 


ala 


ala 


val 


leu glu 


pro 


gly 


241/81 










271/91 














TTA CGA CCA GGG 


AAT TTC GAA 


AAT 


GTT 


ATT 


CAG AAC 


ATC 


TTG 


TAT 


CTC 


TTC 


CTC 


CGT 


GCC 


leu arg pro gly 


asn phe glu 


asn 


val 


ile 


gin asn 


ile 


leu 


tyr 


leu phe 


leu 


arg 


ala 


301/101 










331/111 














ACC CCC TAG GTG 


TAG TGT TTT 


CGA 


GTA 


CCG 


GCA GAT 


CCC 


AGT 


TCA 


CCA 


GTC 


TCA 


CCA 


GAT 


thr pro AMB val 


AMB cys phe 


arg 


val 


pro 


ala asp 


pro 


ser 


ser 


pro 


val 


ser 


pro 


asp 



c 



SEQ ID N° 14A 
FIGURE 14A 

















32/11 














CAC CGG GGC 


TGG AGG 


GGC 


GAA 


TGT 


GCG 


CCG 


AAC GCC 


GTC 


GGC 


CAA 


CTT 


GGC 


CGC TGA GGG 


his arg gly trp arg gly glu 


cys 


ala 


pro 


asn ala 


val 


gly 


gin 


leu gly arg OPA gly 


62/21 














92/31 














CGG CTG ATC 


CCC TGG 


CCC 


GAG 


ACG 


GGG 


CAA 


GCC AAT 


AGC 


GGC 


TCC 


ATC 


GGG 


CTT TGC TGG 


arg leu ile 


pro trp 


pro 


glu 


thr 


gly 


gin 


ala asn 


ser 


gly 


ser 


ile 


gly 


leu cys trp 


122/41 














152/51 










TAG CGG TTC 


GGC GGG 


AAC 


CGA 


GCG 


CCG 


ACG 


TTG TCG 


GTG 


CCC 


GGT 


GAT 


ATA 


TTG GGT CAG 


AMB arg phe 


gly gly 


asn 


arg 


ala 


pro 


thr 


leu ser 


val 


pro 


gly 


asp 


ile 


leu gly gin 


182/61 














212/71 












ACG GGT ATG 


GCG GCG 


ACT 


GAG 


GTG 


ATC 


TGC 


GAC ACG 


CCG 


CCG 


CGG 


TGC 


TCG 


AGC CAG GCT 


thr gly met 


ala ala 


thr 


glu 


val 


ile 


cys 


asp thr 


pro 


pro 


arg 


cys 


ser 


ser gin ala 


242/81 














272/91 












TAC GAC CAG 


GGA ATT 


TCG 


AAA 


ATG 


TTA 


TTC 


AGA ACA 


TCT 


TGT 


ATC 


TCT 


TCC 


TCC GTG CCA 


tyr asp gin 


gly ile 


ser 


lys 


met 


leu 


phe 


arg thr 


ser 


cys 


ile 


ser 


ser 


ser val pro 


302/101 














332/111 












CCC CCT AGG 


TGT AGT 


GTT 


TTC 


GAG 


TAC 


CGG 


CAG ATC 


CCA 


GTT 


CAC 


CAG 


TCT 


CAC CAG ATC 


pro pro arg 


cys ser 


val 


phe 


glu 


tyr 


arg 


gin ile 


pro 


val 


his 


gin 


ser 


his gin ile 



SEQ ID N° 14B 
FIGURE 14B 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



44/185 



ACC GGG 


GCT 


GGA 


GGG 


GCG 


thr gly 


ala 


gly 


gly 


ala 


63/21 










GGC TGA 


TCC 


CCT 


GGC 


CCG 


gly OPA 


ser 


pro 


gly 


pro 


123/41 










AGC GGT 


TCG 


GCG 


GGA 


ACC 


ser gly 


ser 


ala 


gly 


thr 


LOO/ OX 










CGG GTA 


TGG 


CGG 


CGA 


CTG 


arg val 


trp 


arg 


arg 


leu 


243/81 










ACG ACC 


AGG 


GAA 


TTT 


CGA 


thr thr 


arg 


glu 


phe 


arg 


303/101 










CCC CTA 


GGT 


GTA 


GTG 


TTT 


pro leu 


gly 


val 


val 


phe 











jj/ ii 




ZVZVT 
AAi 






CGA 


Apr ncc* 
ACG CCG 


TTT* 
1 CG 


asn 


VPS 1 

val 


arg 


arg 


tnr pro 


ser 










93/31 




AGA 


r+ r> 

CGG 


GGC 


AAG 


CCA ATA 


GCG 


arg 


arg 


gly 


lys 


pro ile 


ala 










1 HQ / CI 








CGA 


CGI 


IGi CGG 


1 GC 


gxu 


arg 


arg 


arg 


cys arg 


cys 










zlo/ /l 




ncc 




1 Vm> 1 


CCC 


apa p^:p 


err 


arg 


OPA 


ser 


ala 


thr arg 


arg 










273/91 




AAA 


TGT 


TAT 


TCA 


GAA CAT 


CTT 


lys 


cys 


tyr 


ser 


glu his 


leu 










333/111 




TCG 


AGT 


ACC 


GGC 


AGA TCC 


CAG 


ser 


ser 


thr 


gly 


arg ser 


gin 



SEQ ID N° 14C 
FIGURE 14C 



GCC 


AAC 


TTG 


GCC 


GCT 


GAG 


GGC 


ala 


asn 


leu 


ala 


ala 


glu 


gly 


GCT 


CCA 


TCG 


GGC 


TTT 


GCT 


GGT 


ala 


pro 


ser 


gly phe 


ala gly 


CCG 


GTG 


ATA 


TAT 


TGG 


GTC 


AGA 


pro 


val 


ile 


tyr 


trp 


val 


arg 


CGC 


GGT 


GCT 


CGA 


GCC 


AGG 


CTT 


arg gly 


ala 


arg 


ala 


arg 


leu 


GTA 


TCT 


CTT 


CCT 


CCG 


TGC 


CAC 


val 


ser 


leu 


pro 


pro 


cys 


his 


TTC 


ACC 


AGT 


CTC 


ACC 


AGA 


TC 


phe 


thr 


ser 


leu 


thr 


arg 





partie de la sequence nucleotidique de seq!4A 
1/1 31/11 

TTT TCG AGT ACC GGC AGA TCC CAG GTT CAC CAG GTC TCA CCA GAT C 
phe ser ser thr gly arg ser gin val his gin val ser pro asp 

SEQ ID N° 14A' 
FIGURE 14A" 



1/1 31/11 

TGT TTT CGA GTA CCG GCA GAT CCC AGG TTC ACC AGG TCT CAC CAG ATC 
cys phe arg val pro ala asp pro arg phe thr arg ser his gin ile 

SEQ ID N° 14C 
FIGURE 14C 



1/1 

GTT TTC GAG TAC CGG 
val phe glu tyr arg 



CAG ATC CCA GGT TCA 
gin ile pro gly ser 



31/11 

CCA GGT CTC ACC AGA TC 
pro gly leu thr arg 



SEQ ID N° 14C* 



FIGURE 14C* 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCTYFR98/01813 



45/185 



ORF prddite d'apres la sequence publiee par Cole et al. (Nature 393:537-544) et 
contenant seql4A f 

1/1 31/11 

TAG CGG TTC GGC GGG AAG CTA GCG GCG ACG TTG TCG GTG GCC GGT GAT ATA TTG GGT CAG 
AMB arg phe gly gly lys leu ala ala thr leu ser val ala gly asp ile leu gly gin 
61/21 91/31 

ACG GGT ATG GCG GCG GCT GAG GTG ATC TGC GAC ACG CCG CCG CGG TGC TCG AGC CAG GCT 
thr gly met ala ala ala glu val ile cys asp thr pro pro arg cys ser ser gin ala 
121/41 151/51 

TAC GAC CAG GGA ATT TCG AAA ATG TTA TTC AGA ACA TCT TGT ATC TCT TCT CCG TGC CAC 
tyr asp gin gly ile ser lys met leu phe arg thr ser cys ile ser ser pro cys his 
181/61 211/71 

CCC CTA GGT GTA GTG TTT TCG AGT ACC GGC AGA TCC CAG GTT CAC CAG GTC TCA CCA gat 
pro leu gly val val phe ser ser thr gly arg ser gin val his gin val ser pro asp 
241/81 271/91 

cca egg ggc gcg atg aac ttc ccg gca teg gca teg cca ggt cga egg acg tgg teg cgc 
pro arg gly ala met asn phe pro ala ser ala ser pro gly arg arg thr trpser arg 
301/101 331/111 

tat gac ggg aat ctg gag cct tgt egg gee get caa cat ate gaa gat gca eta ctt gag 
tyr asp gly asn leu glu pro cys arg ala ala gin his ile glu asp ala leu leu glu 
361/121 391/131 

teg ttg cca gat cct gtc aga ttc ccg att tec gca aag gag egg tac gee cat gac cgt 
ser leu pro asp pro val arg phe pro ile ser ala lys glu arg tyr ala his asp arg 
421/141 

gac cgt tta cac taa 
asp arg leu his OCH 



SEQ ID N° 14F 
FIGURE 14F 



FEUILLE DE REM PLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



46/185 



Sequence Rv3054c predite par Cole et 1. (Nature 393:537-544) 
pouvant etre en phase avec Seql4A' 

1/1 31/11 

gtg tea gat acc aag tec gac ate aaa ate ttg gec tta gtg gga age ctg cgc gcg gcg 
val ser asp thr lys ser asp ile lys ile leu ala leu val gly ser leu arg ala ala 
61/21 91/31 



teg ttc aac cgc cag ate gee gag ctg get gec aag gtc get ccg gac ggc gtc acc gtc 
ser phe asn arg gin ile ala glu leu ala ala lys val ala pro asp gly val thr val 
121/41 151/51 



acc atg ttc gag 


ggg ctg ggg gac 


ctg 


ccg 


ttc tac 


aac 


gaa 


gac 


ate 


gac 


aca 


gcg 


acg 


thr met phe glu gly leu gly asp 


leu 


pro 


phe tyr 


asn 


glu 


asp 


ile 


asp 


thr 


ala 


thr 


181/61 








211/71 
















gag gtg ccg gcg 


ccg gtg age gcg 


ttg 


egg 


gag gee 


gcg 


tct 


gac 


gcg 


cac 


get 


gec 


ttg 


glu val pro ala pro val ser ala 


leu 


arg 


glu ala 


ala 


ser 


asp 


ala 


his 


ala 


ala 


leu 


241/81 








271/91 


















gtg gtc acg ccg 


gaa tac aac ggc 


age 


att 


ccg gee 


gtg 


ate 


aag 


aac 


gcg 


ate 


gac 


tgg 


val val thr pro 


glu tyr asn gly 


ser 


ile 


pro ala 


val 


ile 


lys 


asn 


ala 


ile 


asp 


trp 


301/101 








331/111 














ctg tec agg cca 


ttc ggc gat ggc 


gcg 


ttg 


aag gac 


aag 


ccg 


ttg 


gec 


gtg 


ate 


ggc 


ggc 


leu ser arg pro 


phe gly asp gly 


ala 


leu 


lys asp lys 


pro 


leu 


ala 


val 


ile 


gly gly 


361/121 








391/131 


















tec atg ggc cgc 


tac ggc ggg gta 


tgg 


gcg 


cac gac 


gag 


act 


cgc 


aag 


teg 


ttc 


age 


ate 


ser met gly arg 


tyr gly gly val 


trp 


ala 


his asp 


glu 


thr arg lys 


ser 


phe 


ser 


ile 


421/141 








451/151 
















get ggc acg egg 


gtg gtc gat gcg 


ate 


aaa 


ctg teg 


gtg 


ccg 


ttc 


caa 


act 


ctg 


ggc 


aag 


ala gly thr arg 


val val asp ala 


ile 


lys 


leu ser 


val pro phe gin 


thr 


leu 


gly lys 


481/161 








511/171 


















teg gtc gcg gac 


gac gee ggg ctg 


gcg 


gcg 


aat gtg 


cgc 


gac 


gee 


gtc 


ggc 


aac 


ttg 


gee 


ser val ala asp 


asp ala gly leu 


ala 


ala 


asn val 


arg 


asp 


ala 


val 


gly 


asn 


leu 


ala 



541/181 
get gag gtc ggc tga 
ala glu val gly OPA 



SEQ ID N° 14R 
FIGURE 14R 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



47/185 



ORF predite par Cole et al. 
1/1 

taa cgc gat egg aat aaa teg 
OCH arg asp arg asn lys ser 
61/21 

caa gcg gaa agg aac gta gca 
gin ala glu arg asn val ala 
121/41 

gtg gga age ctg cgc gcg gcg 
val gly ser leu arg ala ala 
181/61 

get ccg gac ggc gtc ace gtc 
ala pro asp gly val thr val 
241/81 

gaa gac ate gac aca gcg acg 
glu asp ile asp thr ala thr 
301/101 

tct gac gcg cac get gcc ttg 
ser asp ala his ala ala leu 
361/121 

ate aag aac gcg ate gac tgg 
ile lys asn ala ile asp trp 
421/141 

ccg ttg gcc gtg ate ggc ggc 
pro leu ala val ile gly gly 
481/161 

act cgc aag teg ttc age ate 
thr arg lys ser phe ser ile 
541/181 

ccg ttc caa act ctg ggc aag 
pro phe gin thr leu gly lys 
601/201 

gac gcc gtc ggc aac ttg gcc 
asp ala val gly asn leu ala 



(Nature 393 : 537-544) et 
31/11 

gac cat ggt ccg gtt ggc 
asp his gly pro val gly 
91/31 

gtg tea gat acc aag tec 
val ser asp thr lys ser 
151/51 

teg ttc aac cgc cag ate 
ser phe asn arg gin ile 
211/71 

acc atg ttc gag ggg ctg 
thr met phe glu gly leu 

271/91 
gag gtg ccg gcg ccg gtg 
glu val pro ala pro val 

331/111 
gtg gtc acg ccg gaa tac 
val val thr pro glu tyr 

391/131 
ctg tec agg cca ttc ggc 
leu ser arg pro phe gly 

451/151 
tec atg ggc cgc tac ggc 
ser met gly arg tyr gly 

511/171 
get ggc acg egg gtg gtc 
ala gly thr arg val val 

571/191 
teg gtc gcg gac gac gcc 
ser val ala asp asp ala 

631/211 
get gag gtc ggc tga 
ala glu val gly OPA 



SEQ ID N° 14P 
FIGURE 14P 



contenant Rv3054c 



teg 
ser 


tgc 
cys 


aag 
lys 


gac 
asp 


gtg 
val 


gac caa 
asp gin 


gac 
asp 


ate 
ile 


aaa 
lys 


ate 
ile 


ttg 

leu 


gcc 
ala 


tta 
leu 


gcc 
ala 


gag 
glu 


ctg 
leu 


get 
ala 


gcc 
ala 


aag 
lys 


gtc 
val 


ggg gac ctg 
gly asp leu 


ccg 
pro 


ttc 
phe 


tac 
tyr 


aac 
asn 


age 
ser 


gcg 
ala 


ttg 
leu 


egg 
arg 


gag gcc gcg 
glu ala ala 


aac 
asn 


ggc 
gly 


age 
ser 


att 
lie 


ccg 
pro 


gcc 
ala 


gtg 
val 


gat ggc gcg 
asp gly ala 


ttg 
leu 


aag 
lys 


gac aag 
asp lys 


ggg gta 
gly val 


tgg 
trp 


gcg 
ala 


cac 
his 


gac gag 
asp glu 


gat 
asp 


gcg 
ala 


ate 
ile 


aaa 
lys 


ctg 
leu 


teg 
ser 


gtg 
val 


ggg ctg gcg 
gly leu ala 


gcg 
ala 


aat 
asn 


gtg 
val 


cgc 
arg 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



48/185 



fragment d'apres la sequence publiee par Cole et al. (Nature 393:537-544) et contenant 
seq 14F 1 et seq 14P 1 

1/1 31/11 

taa cgc gat egg aat aaa teg gac cat ggt ccg gtt ggc teg tgc aag gac gtg gac caa 
OCH arg asp arg asn lys ser asp his gly pro val gly ser cys lys asp val asp gin 
asn ala lie gly ile asn arg thr met val arg leu ala arg ala arg thr trp thr asn 
thr arg ser glu OCH ile gly pro trp ser gly trp leu val gin gly arg gly pro thr 
61/21 91/3! 

caa gcg gaa agg aac gta gca gtg tea gat acc aag tec gac ate aaa ate ttg gee tta 
gin ala glu arg asn val ala val ser asp thr lys ser asp ile lys ile leu ala leu 
lys arg lys gly thr AMB gin cys gin ile pro ser pro thr ser lys ser trp pro AMB 
ser gly lys glu arg ser ser val arg tyr gin val arg his gin asn leu gly leu ser 
121/41 151/51 

gtg gga age ctg cgc gcg gcg teg ttc aac cgc cag ate gec gag ctg get gee aag gtc 
val gly ser leu arg ala ala ser phe asn arg gin ile ala glu leu ala ala lys val 

trp glu ala cys ala arg arg arg ser thr ala arg ser pro ser trp leu pro arg ser 
gly lys pro ala arg gly val val gin pro pro asp arg arg ala gly cys gin gly arg 
181/61 211/71 y 

get ccg gac ggc gtc acc gtc acc atg ttc gag ggg ctg ggg gac ctg ccg ttc tac aac 
ala pro asp gly val thr val thr met phe glu gly leu gly asp leu pro phe tyr asn 

leu arg thr ala ser pro ser pro cys ser arg gly trp gly thr cys arg ser thr thr 
ser gly arg arg his arg his his val arg gly ala gly gly pro ala val leu gin arg 
241/81 271/91 

gaa gac ate gac aca gcg acg gag gtg ccg gcg ccg gtg age gcg ttg egg gag gee gcg 
glu asp ile asp thr ala thr glu val pro ala pro val ser ala leu arg glu ala ala 
lys thr ser thr gin arg arg arg cys arg arg arg OPA ala arg cys gly arg pro arg 
arg his arg his ser asp gly gly ala gly ala gly glu arg val ala gly gly arg val 
301/101 331/111 

tct gac gcg cac get gec ttg gtg gtc acg ccg gaa tac aac ggc age att ccg gec gtg 
ser asp ala his ala ala leu val val thr pro glu tyr asn gly ser ile pro ala val 
leu thr arg thr leu pro trp trp ser arg arg asn thr thr ala ala phe arg pro OPA 

^\ arg ala arg cys leu gly gly his ala Sly ile gin arg gin his ser gly arg asp 
361/121 3917131 

ate aag aac gcg ate gac tgg ctg tec agg cca ttc ggc gat ggc gcg ttg aag gac aag 
ile lys asn ala ile asp trp leu ser arg pro phe gly asp gly ala leu lys asp lys 
ser arg thr arg ser thr gly cys pro gly his ser ala met ala arg OPA arg thr ser 
gin glu arg* asp arg leu ala val gin ala ile arg arg trp arg val glu gly gin ala 
421/141 451/151 

ccg ttg gee gtg ate ggc ggc tec atg ggc cgc tac ggc ggg gta tgg gcg cac gac gag 
pro leu ala val ile gly gly ser met gly arg tyr gly gly val trp ala his asp glu 
arg trp pro OPA ser ala ala pro trp ala ala thr ala gly tyr gly arg thr thr arg 
val gly arg asp arg arg leu his gly pro leu arg arg gly met gly ala arg arg aso 
481/161 511/171 

act cgc aag teg ttc age ate get ggc acg egg gtg gtc gat gcg ate aaa ctg teg gtg 
thr arg lys ser phe ser ile ala gly thr arg val val asp ala ile lys leu ser val 
leu ala ser arg ser ala ser leu ala arg gly trp ser met arg ser asn cys arg cys 
ser gin val val gin his arg trp his ala gly gly arg cys asp gin thr val gly ala 
541/181 571/191 

ccg ttc caa act ctg ggc aag teg gtc gcg gac gac gee ggg ctg gcg gcg aat gtg cgc 
pro phe gin thr leu gly lys ser val ala asp asp ala gly leu ala ala asn val arg 
arg ser lys leu trp ala ser arg ser arg thr thr pro gly trp arg arg met cys ala 
val pro asn ser gly gin val gly arg gly arg arg arg ala gly gly glu cys ala arg 
601/201 631/211 

gac gec gtc ggc aac ttg gec get gag gtc ggc tga tec ctg ggc cga ggc ggg tea gec 
asp ala val gly asn leu ala ala glu val gly OPA ser leu gly arg gly gly se r ala 
thr pro ser ala thr trp pro leu arg ser ala asp pro trp ala glu ala gly gin pro 
arg arg arg gin leu gly arg OPA gly arg leu ile pro gly pro arg arg val ser gin 
661/221 691/231 

aat age ggc tec ate ggc ttt get ggt age ggt teg gcg gga age tag egg cga cgt tgt 
asn ser gly ser ile gly phe ala gly ser gly ser ala gly ser AMB arg arg arg cys 
ile ala ala pro ser ala leu leu val ala val arg arg glu ala ser gly asp val val 
AMB arg leu his arg leu cys trp AMB arg phe gly gly lys leu ala ala thr leu ser 

SEQ ID N° 14Q 



FEUILLE DE REM^^Qg|flE^j(REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



49/185 



721/241 751/251 

egg tgg ccg gtg ata tat tgg gtc aga egg gta tgg egg egg ctg agg tga tct gcg aca 
arg trp pro val ile tyr trp val arg arg val trp arg arg leu arg OPA 3er ala thr 
gly gly arg OPA tyr ile gly ser asp gly tyr gly gly gly OPA gly asp leu arg his 
val ala gly asp ile leu gly gin thr gly met ala ala ala glu val ile cys asp thr 
781/261 811/271 

cgc cgc cgc ggt get cga gee agg ctt acg acc agg gaa ttt cga aaa tgt tat tea gaa 
arg arg arg gly ala arg ala arg leu thr thr arg glu phe arg lys cys tyr ser glu 
ala ala ala val leu glu pro gly leu arg pro gly asn phe glu asn val ile gin asn 
pro pro arg cys ser ser gin ala tyr asp gin gly ile ser lys met leu phe arg thr 
841/281 871/291 

cat ctt gta tct ctt etc cgt gec acc ccc tag gtg tag tgt ttt cga gta ccg gca gat 
his leu val ser leu leu arg ala thr pro AMB val AMB cys phe arg val pro ala asp 
ile leu tyr leu phe ser val pro pro pro arg cys ser val phe glu tyr arg gin ile 
ser cys ile ser ser pro cys his pro leu gly val val phe ser ser thr gly arg ser 
901/301 931/311 

ccc agg ttc acc agg tct cac cag ate cac ggg gcg cga tga act tec egg cat egg cat 
pro arg phe thr arg ser his gin ile his gly ala arg OPA thr ser arg his arg his 
pro gly ser pro gly leu thr arg ser thr gly arg asp glu leu pro gly ile gly ile 
gin val his gin val ser pro asp pro arg gly ala met asn phe pro ala ser ala ser 
961/321 991/331 

cgc cag gtc gac gga cgt ggt cgc get atg acg gga ate tgg age ctt gtc ggg ccg etc 
arg gin val asp gly arg gly arg ala met thr gly ile trp ser leu val gly pro leu 
ala arg ser thr asp val val ala leu OPA arg glu ser gly ala leu ser gly arg ser 
pro gly arg arg thr trp ser arg tyr asp gly asn leu glu pro cys arg ala ala gin 
1021/341 1051/351 

aac ata teg aag atg cac tac ttg agt cgt tgc cag ate ctg tea gat tec cga ttt ccg 
asn ile ser lys met his tyr leu ser arg cys gin ile leu ser asp ser arg phe pro 
thr tyr arg arg cys thr thr OPA val val ala arg ser cys gin ile pro asp phe arg 
his ile glu asp ala leu leu glu ser leu pro asp pro val arg phe pro ile ser ala 
1081/361 1111/371 
caa agg age ggt acg ccc atg acc gtg acc gtt tac act aa 
gin arg ser gly thr pro met thr val thr val tyr thr 
lys gly ala val arg pro OPA pro OPA pro phe thr leu 
lys glu arg tyr ala his asp arg asp arg leu his OCH 



SEQ ID N° 14Q (suite) 



FIGURE 14Q (suite) 



1/1 

CAA GCC CGG CCG 
gin ala arg pro 
61/21 

GCG CAC CAT GGT 
ala his his gly 
121/41 

CGA TGC CCG CGC 
arg cys pro arg 
181/61 

GGC GGA CCA GTC 
gly gly pro val 
241/81 

GTC TGA GGT GGC 
val OPA gly gly 



CGA CTG TTT GCC 
arg leu phe ala 

GTG CAC CAG TTG 
val his gin leu 

CCC GGC GGC GCA 
pro gly gly ala 

GGC GAT GTC GAG 
gly asp val glu 

GAA GAC CAG TCC 
glu asp gin ser 



31/11 
GTT TTG GGG CTC 
val leu gly leu 

91/31 
CGA TCG GTT CCT 
arg ser val pro 

151/51 
GCT GCG TAG CTC 
ala ala AMB leu 

211/71 
GCG ATG GCA ATA 
ala met ala ile 

271/91 
CGC GCC CAC CGG 
arg ala his arg 



CTA CCA GAA CAC 
leu pro glu his 

CCC GCG CGC GGG 
pro ala arg gly 

GAC CCG GTC GAC 
asp pro val asp 

CAG CGC CTT GGT 
gin arg leu gly 

CAG CCG GAT CCG 
gin pro asp pro 



CAC CTG GCG GCC 
his leu ala ala 

CGG CGA CGA CGT 
arg arg arg arg 

GAC GAC GGG GTC 
asp asp gly val 

GCG CGG CCA CAC 
ala arg pro his 

GAT ACG CGG TAC 
asp thr arg tyr 



SEQ ID N° 15A 



FEUILLE DE REIt#£W0eMBf^(REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



50/185 



AAG CCC GGC CGC GAC TGT TTG 
lys pro gly arg asp cys leu 
62/21 

CGC ACC ATG GTG TGC ACC AGT 
arg thr met val cys thr ser 
122/41 

GAT GCC CGC GCC CCG GCG GCG 
asp ala arg ala pro ala ala 
182/61 

GCG GAC CAG TCG GCG ATG TCG 
ala asp gin ser ala met ser 
242/81 

TCT GAG GTG GCG AAG ACC AGT 
ser glu val ala lys thr ser 









oz/ 11 




CCG 


TTT 


TGG 






pro phe trp 


giy ser 


tyr 








yz/ oi 




TGC 


GAT 


CGG 


1 1L> Lit 




cys 


asp 


arg 


nh a 1 o 1 1 


pro 








152/51 




CAG 


CTG 


CGT 


AGC TCG 


ACC 


gin 


leu 


arg 


ser ser 


thr 








212/71 




AGG 


CGA 


TGG 


CAA TAC 


AGC 


arg 


arg 


trp 


gin tyr 


ser 








272/91 




CCC 


GCG 


CCC 


ACC GGC 


AGC 


pro 


ala 


pro 


thr gly 


ser 



SEQ ID N° 15B 
FIGURE 15B 



CAG AAC ACC ACC TGG CGG CCG 
gin asn thr thr trp arg pro 

CGC GCG GGC GGC GAC GAC GTC 
arg ala gly gly asp asp val 

CGG TCG ACG ACG ACG GGG TCG 
arg ser thr thr thr gly ser 

GCC TTG GTG CGC GGC CAC ACG 
ala leu val arg gly his thr 

CGG ATC CGG ATA CGC GGT AC 
arg ile arg ile arg gly 



AGC CCG GCC GCG ACT GTT TGC 
ser pro ala ala thr val cys 
63/21 

GCA CCA TGG TGT GCA CCA GTT 
ala pro trp cys ala pro val 
123/41 

ATG CCC GCG CCC CGG CGG CGC 
met pro ala pro arg arg arg 
183/61 

CGG ACC AGT CGG CGA TGT CGA 
arg thr ser arg arg cys arg 
243/81 

CTG AGG TGG CGA AGA CCA GTC 
leu arg trp arg arg pro val 









33/11 




CGT 


TTT 


GGG 


GCT CCT 


ACC 


arg 


phe 


gly 


ala pro 


thr 








93/31 




GCG 


ATC 


GGT 


TCC TCC 


CGC 


ala 


ile 


gly 


ser ser 


arg 








153/51 




AGC 


TGC 


GTA 


GCT CGA 


CCC 


ser 


cys 


val 


ala arg 


pro 








213/71 




GGC 


GAT 


GGC 


AAT ACA 


GCG 


gly asp 


gly 


asn thr 


ala 








273/91 




CCG 


CGC 


CCA 


CCG GCA 


GCC 


pro 


arg 


pro 


pro ala 


ala 



SEQ ID N° 15C 
FIGURE 15C 



AGA ACA CCA CCT GGC GGC CGC 
arg thr pro pro gly gly arg 

GCG CGG GCG GCG ACG ACG TCG 
ala arg ala ala thr thr ser 

GGT CGA CGA CGA CGG GGT CGG 
gly arg arg arg arg gly arg 

CCT TGG TGC GCG GCC ACA CGT 
pro trp cys ala ala thr arg 

GGA TCC GGA TAC GCG GTA C 
gly ser gly tyr ala val 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PC17FR98/01813 



51/185 



partie de la sequence nucleotidique de seqlSA 



1/1 


















31/11 
















GGC GGC 


CGC 


GCG 


CCA 


TGG 


TGT 


GCA 


CCA 


GTT 


GCG ATC 


GGT 


TCT 


CCC 


GCG 


CGC GGG 


CGG 


CGA 


gly gly 
61/21 


arg 


ala 


pro 


trp 


cys 


ala 


pro 


val 


ala ile 
91/31 


gly 


ser 


pro 


ala 


arg gly arg 


arg 


CGA CGT 


CGA 


TGG 


CCG 


CGC 


CCC 


GGC 


GGC 


TGC 


AGC TGC 


GTA 


GCT 


CGA 


CCC 


GGT CGA 


CGA 


CGA 


arg arg 
121/41 


arg 


trp pro 


arg 


pro 


gly gly 


cys 


ser cys 
151/51 


val 


ala 


arg 


pro gly arg 


arg 


arg 


CGG GGT 


CGG 


CGG 


GCC 


AGT 


CGG 


CGA 


TGT 


CGA 


GGC GAT 


GGC 


AAT 


ACA 


GCG 


CCT TGG 


TGC 


GCG 


arg gly 
181/61 


arg 


arg 


ala 


ser 


arg 


arg 


cys 


arg 


gly asp 
211/71 


gly 


asn 


thr 


ala 


pro trp 


cys 


ala 


GCC ACA 


CGT 


CTG 


AGG 


TGG 


CGA 


AGA 


CCA 


GTC 


CCG CGC 


CCA 


CCG 


GCA 


GCC 


GGA TC 






ala thr 


arg 


leu 


arg 


trp 


arg 


arg 


pro 


val 


pro arg 


pro 


pro 


ala 


ala 


gly 







SEQ ID N° ISA' 
FIGURE 15A» 



1/1 

GCG GCC GCG CGC CAT GGT GTG 
ala ala ala arg his gly val 
61/21 

GAC GTC GAT GGC CGC GCC CCG 
asp val asp gly arg ala pro 
121/41 

GGG GTC GGC GGG CCA GTC GGC 
gly val gly gly pro val gly 
181/61 

CCA CAC GTC TGA GGT GGC GAA 
pro his val OPA gly gly glu 



31/11 

CAC CAG TTG CGA TCG GTT 
his gin leu arg ser val 
91/31 

GCG GCT GCA GCT GCG TAG 
ala ala ala ala ala AMB 

' 151/51 
GAT GTC GAG GCG ATG GCA 
asp val glu ala met ala 
211/71 

GAC CAG TCC CGC GCC CAC 
asp gin ser arg ala his 

SEQ ID N° 15B' 
FIGURE 15B' 



CTC CCG CGC GCG GGC GGC GAC 
leu pro arg ala gly gly asp 

CTC GAC CCG GTC GAC GAC GAC 
leu asp pro val asp asp asp 

ATA CAG CGC CTT GGT GCG CGG 
ile gin arg leu gly ala arg 

CGG CAG CCG GAT C 
arg gin pro asp 



1/1 

TGG CGG CCG CGC GCC 
trp arg pro arg ala 
61/21 

ACG ACG TCG ATG GCC 
thr thr ser met ala 
121/41 

ACG GGG TCG GCG GGC 
thr gly ser ala gly 
181/61 

GGC CAC ACG TCT GAG 
gly his thr ser glu 



ATG GTG TGC ACC AGT 
met val cys thr ser 

GCG CCC CGG CGG CTG 
ala pro arg arg leu 

CAG TCG GCG ATG TCG 
gin ser ala met ser 

GTG GCG AAG ACC AGT 
val ala lys thr ser 



SEQ ID 



31/11 

TGC GAT CGG TTC TCC 
cys asp arg Dhe ser 
Sl/31 

CAG CTG CGT AGC TCG 
gin leu arg ser ser 
151/51 

AGG CGA TGG CAA TAC 
arg arg trp gin tyr 
211/71 

CCC GCG CCC ACC GGC 
pro ala pro thr gly 

N° 15C 



CGC GCG CGG GCG GCG 
arg ala arg ala ala 

ACC CGG TCG ACG ACG 
thr arg ser thr thr 

AGC GCC TTG GTG CGC 
ser ala leu val arg 

AGC CGG ATC 
ser arg ile 



FEUILLE DE RENtf&AC&MEH<C (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



52/185 



ORE 1 contenant SeqlSA' d'apr^s Cole et al. (Nature 393:537-544) 



1/1 31/11 



taa ggt 


ccg 


cca 


acg 


ctt 


tac 


get 


cga 


egg 


ccg cca 


cga 


gtt 


ggc 


egg 


cca 


ctt 


tea 


ggc 


OCH gly pro pro 


thr 


leu 


tyr 


ala 


arg 


arg 


pro pro 


arg 


val 


gly 


arg 


pro 


leu 


ser 


gly 


61/21 


















91/31 


















cgt agt 


cgc 


cgc 


agg 


gca 


ggg 


ctt 


ccc 


gcg 


teg tct 


teg 


egg 


gtt 


tgt 


egg 


caa 


agg 


tgt 


arg ser 


arg 


arg 


arg 


ala 


gly leu pro 


ala 


ser ser 


ser 


arg 


val 


cys 


arq 


qln 


arg 


cys 


121/41 


















151/51 


















agg ggt 


age 


gtt 


cgt 


ggg 


cgt 


cga 


cga 


cga 


tgt gca 


get 


egg 


gga 


tgc 


egg 


egg 


cgc 


ggg 


arg gly 


ser 


val 


arg gly 


arg 


arg 


arg 


arg 


cys ala 


ala 


arg 


gly cys 


arq 


arq 


arg gly 


181/61 


















211/71 


















egg tgg 


ggg 


tgc 


gca 


cgc 


ccg 


gee 


gcg 


act 


gtt tgc 


gcg 


ttt 


tgg 


ggc 


tct 


gec 


aga 


aca 


arg trp gly cys 


ala 


arg 


pro 


ala 


ala 


thr 


val cys 


ala 


one 


trp 


gly 


ser 


ala 


arg 


thr 


241/81 


















271/91 


















cca cct 


ggc 


ggc 


cgc 


gcg 


cca 


tgg 


tgt 


gca 


cca gtt 


qcq 


ate 


ggt 


tct 


ccc 


qcq 


cgc 


ggg 


pro pro 


gly gly 


arg 


ala 


pro 


trp 


cys 


ala 


pro val 


ala 


ile 


gly 


ser 


pro 


ala 


arg 


gly 


301/101 


















331/111 


















egg cga 


cga 


cgt 


cga 


tgg 


ccg 


cgc 


ccc 


ggc 


ggc tgc 


age 


tgc 


gta 


get 


cqa 


ccc 


ggt 


cga 


arg arg 


arg 


arg 


arg 


trp 


pro 


arg 


pro 


gly gly cys 


ser 


cys 


val 


ala 


arg 


pro 


gly 


arg 


361/121 


















391/131 


















cga cga 


egg 


ggt 


egg 


egg 


gec 


agt 


egg 


cga 


tgt cga 


ggc 


gat 


ggc 


aat 


aca 


gcg 


cct 


tgg 


arg arg arg gly arg arg 


ala 


ser 


arg 


arg 


cys arg 


gly 


asp 


gly 


asn 


thr 


ala 


pro 


trp 


421/141 


















451/151 


















tgc gcg 


gec 


aca 


cgt 


ctg 


agg 


tgg 


cga 


aga 


cca gtc 


ccg 


cgc 


cca 


ccg 


gca 


gec 


gga 


tea 


cys ala 


ala 


thr 


arg 


leu 


arg 


trp 


arg 


arg 


pro val 


pro 


arg 


pro 


pro 


ala 


ala 


gly 


ser 


481/161 


















511/171 


















ggt agg 


gca 


ggc 


gcg 


agt 


ctt 


cag 


egg 


ggt 


tgg egg 


cga 


cga 


gca 


get 


cca 


cag 


agt 


gtg 


gly arg 


ala 


gly 


ala 


ser 


leu 


gin 


arg gly trp arg 


arg 


arg 


ala 


ala 


pro 


gin 


ser 


val 


541/181 


















571/191 


















agg gta 


egg 


gcg 


gcg 


tac 


ggc 


aac 


ggt 


gaa 


gca ggc 


act 


ccg 


acg 


aac 


cca 


teg 


tea 


cgt 


arg val 


arg 


ala 


ala 


tyr 


gly 


asn 


gly glu 


ala gly 


thr 


pro 


thr 


asn 


pro 


ser 


ser 


arg 



601/201 

cga agg ggc agg tga 
arg arg gly arg OPA 



SEQ ID N° 15F 
FIGURE 15F 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



53/185 



R:Rv2530c predite d'apres Cole et al . 

phase avec SEQ15A 

1/1 

gtg acg gca ctg etc gat gtc aat gtg ctg 
val thr ala leu leu asp val asn val leu 
61/21 

cat gcg gec gcg cag cga tgg ttc acg cag 
his ala ala ala gin arg trp phe thr gin 
121/41 

ate acc gag gca ggg tat gtc cga att tea 
ile thr glu ala gly tyr val arg ile ser 
181/61 

acg ccg get ate gcg ate get cag ttg gcg 
thr pro ala ile ala ile ala gin leu ala 
241/81 

tgg cct gac gat gtg cca ctg ate gtt ggg 
trp pro asp asp val pro leu ile val gly 
301/101 

cac cgt egg gtc acc gac tgc cat etc ate 
his arg arg val thr asp cys his leu ile 
361/121 

gtc aca ttc gat gec gca ctg gec gat tea 
val thr phe asp ala ala leu ala asp ser 



(Nature 


393 


:537 


-544)et 


pouvant 


etre en 


31/11 
















ate gcg 


ctg 


ggc 


tgg 


ccg 


aat cac 


gtt 


cac 


ile ala 


leu gly 


trp 


pro 


asn his 


val 


his 


91/31 
















ttc tec 


teg 


aat 


ggg 


tgg 


gee acc 


acg 


ccg 


phe ser 


ser 


asn 


gly trp 


ala thr 


thr 


pro 


151/51 
















age aat 


cgc 


agt 


gtg 


atg 


cag gtg 


teg 


acc 


ser asn 


arg 


ser 


val 


met 


gin val 


ser 


thr 


211/71 
















gcg atg 


act 


tct 


ctt 


gec 


ggg cac 


acg 


ttt 


ala met 


thr 


ser 


leu 


ala 


gly his 


thr phe 


271/91 














age gec 


ggc 


gat 


cgc 


gat 


gcg gtg 


tec 


aac 


ser ala 


gly 


asp 


arg 


asp 


ala val 


ser 


asn 


331/111 
















gee ttg 


gec 


gcg 


cgc 


tac 


ggg ggc 


egg 


ttg 


ala leu 


ala 


ala 


arg tyr gly gly 


arg 


leu 


391/131 
















gca tec 


gca 


ggc 


etc 


gtc 


gag gtg 


ttg 


tag 


ala ser 


ala 


gly 


leu 


val 


glu val leu AMB 



SEQ ID N° 15R 



FIGURE 15R 



SeqlSP: ORF d'apres Cole et al. (Nature 
1/1 

tga tgt tec gee gga tgc gec gac ggt gac 
OPA cys ser ala gly cys ala asp gly asp 
61/21 

cga cgt gtg acg gca ctg etc gat gtc aat 
arg arg val thr ala leu leu asp val asn 
121/41 

gtt cac cat gcg gec gcg cag cga tgg ttc 
val his his ala ala ala gin arg trp phe 
181/61 

acg ccg ate acc gag gca ggg tat gtc cga 
thr pro ile thr glu ala gly tyr val arg 
241/81 

teg acc acg ccg get ate gcg ate get cag 
ser thr thr pro ala ile ala ile ala gin 
301/101 

acg ttt tgg cct gac gat gtg cca ctg ate 
thr phe trp pro asp asp val pro leu ile 
361/121 

tec aac cac cgt egg gtc acc gac tgc cat 
ser asn his arg arg val thr asp cys his 
421/141 

egg ttg gtc aca ttc gat gec gca ctg gec 
arg leu val thr phe asp ala ala leu ala 
481/161 
ttg tag 
leu AMB 

SEQ IE 



393:537-544) contenant Rv2530c 
31/11 

ttc cga gga tgt cgt ccg cgc get cga gga 
phe arg gly cys arg pro arg ala arg gly 
91/31 

gtg ctg ate gcg ctg ggc tgg ccg aat cac 
val leu ile ala leu gly trp pro asn his 
151/51 

acg cag ttc tec teg aat ggg tgg gee acc 
thr gin phe ser ser asn gly trp ala thr 
211/71 

att tea age aat cgc agt gtg atg cag gtg 
ile ser ser asn arg ser val met gin val 
271/91 

ttg gcg gcg atg act tct ctt gee ggg cac 
leu ala ala met thr ser leu ala gly his 
331/111 

gtt ggg age gec ggc gat cgc gat gcg gtg 
val gly ser ala gly asp arg asp ala val 
391/131 

etc ate gec ttg gec gcg cgc tac ggg ggc 
leu ile ala leu ala ala arg tyr gly gly 
451/151 

gat tea gca tec gca ggc etc gtc gag gtg 
asp ser ala ser ala gly leu val glu val 



N° 15P 



FEUILLE DE REMf^^l|^(REGLE 26) 



WO 99/09186 



PCT/FR98/0I8I3 



54/185 



Fragment contenant SeqlSP' et Seq 15F 1 
1/1 31/11 

tga tgt tec gec gga tgc gec gac ggt gac ttc cga gga tgt cgt ccg cgc get cga gga 
OPA cys ser ala gly cys ala asp gly asp phe arg gly cys arg pro arg ala arg gly 
asp val pro pro asp ala pro thr val thr ser glu asp val val arg ala leu glu asp 
Met phe arg arg met arg arg arg OPA leu pro arg met ser ser ala arg ser arg thr 
61/21 91/31 

cga cgt gtg acg gca ctg etc gat gtc aat gtg ctg ate gcg ctg ggc tgg ccg aat cac 
arg arg val thr ala leu leu asp val asn val leu ile ala leu gly trp pro asn his 
asp val OPA arg his cys ser met ser met cys OPA ser arg trp ala gly arg ile thr 
thr cys asp gly thr ala arg cys gin cys ala asp arg ala gly leu ala glu ser arq 
121/41 151/51 

gtt cac cat gcg gee gcg cag cga tgg ttc acg cag ttc tec teg aat ggg tgg gec ace 
val his his ala ala ala gin arg trp phe thr gin phe ser ser asn gly trp ala thr 
phe thr met arg pro arg ser asp gly ser arg ser ser pro arg met gly gly pro pro 

181/61 Pr ° ^ lGU l6U glU Crp Val gly his his 

acg ccg ate ace gag gca ggg tat gtc cga att tea age aat cgc agt gtg atg cag gtg 
thr pro ile thr glu ala gly tyr val arg ile ser ser asn arg ser val met gin val 
arg arg ser pro arg gin gly met ser glu phe gin ala ile ala val OPA cys arg cys 
ala asp his arg gly arg val cys pro asn phe lys gin ser gin cys asp ala gly val 
241/81 271/91 

teg acc acg ccg get ate gcg ate get cag ttg gcg gcg atg act tct ctt gec ggg cac 
ser thr thr pro ala ile ala ile ala gin leu ala ala met thr ser leu ala gly his 
arg pro arg arg leu ser arg ser leu ser trp arg arg OPA leu leu leu pro gly thr 
asp his ala gly tyr arg asp arg ser val gly gly a3 p asp phe ser cys arg ala his 
301/101 331/111 

acg ttt tgg cct gac gat gtg cca ctg ate gtt ggg age gec ggc gat cgc gat gcg gtg 
thr phe trp pro asp asp val pro leu ile val gly ser ala gly asp arg asp ala val 
arg phe gly leu thr met cys his OPA ser leu gly ala pro ala ile ala met arg cys 
val leu ala OPA arg cys ala thr asp arg trp glu arg arg arg ser arg cys gly val 
361/121 391/131 

tec aac cac cgt egg gtc acc gac tgc cat etc ate gec ttg gee gcg cgc tac ggg ggc 
ser asn his arg arg val thr asp cys his leu ile ala leu ala ala arg tyr gly gly 
pro thr thr yal gly ser pro thr ala ile ser ser pro trp pro arg ala thr gly ala 
gin pro pro ser gly his arg leu pro ser his arg leu gly arg ala leu arg gly pro 
421/141 451/151 

egg ttg gtc aca ttc gat gee gca ctg gec gat tea gca tec gca ggc etc gtc gag gtg 
arg leu val thr phe asp ala ala leu ala asp 3er ala ser ala gly leu val glu val 
gly trp ser his ser met pro his trp pro ile gin his pro gin ala ser ser arg cys 
val gly his ile arg cys arg thr gly arg phe ser ile arg arg pro arg arg gly val 
481/161 511/171 

ttg tag tea ccg ggg atg ggc ggc teg cca ggc ctg cag gat ctg egg gcg cag gcg ccc 
leu AMB ser pro gly met gly gly ser pro gly leu gin asp leu arg ala gin ala pro 
cys ser his arg gly trp ala ala arg gin ala cys arg ile cys gly arg arg arg pro 

CJ . V ^ X « Val thr gly asp gly arg leu ala arg P ro ala 9ly 3e * ala gly ala gly ala pro 
541/181 571/191 

ccg gtc gga cac egg cag gee gac get ttt ggc cca cgc gcq cag etc ggc get get ggg 
pro val gly his arg gin ala asp ala phe gly pro arg ala gin leu gly ala ala gly 
arg ser asp thr gly arg pro thr leu leu ala his ala arg ser ser ala leu leu gly 
gly arg thr pro ala gly arg arg phe trp pro thr arg ala ala arg arg cys trp ala 
601/201 631/211 

etc ggg etc ggc ggc age egg etc gaa aac cgt ggt ggc gtc ggc ate gtc gac gaa cca 
leu gly leu gly gly ser arg leu glu asn arg gly gly val gly ile val aso glu pro 
ser gly ser ala ala ala gly ser lys thr val val ala ser ala ser ser thr asn gin 
arg ala arg arg gin pro ala arg lys pro trp trp arg arg his arg arg arg thr arg 



SEQ ID N° 15Q 

FIGURE 15Q 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



55/185 



661/221 691/231 

ggt gag ggc ggc ggc tag ata gcg gta ggt gta ttc ctg ggc gag ctt gcg ggt ttg gca 
gly glu gly gly gly AMB ile ala val gly val phe leu gly glu leu ala gly leu ala 
val arg ala ala ala arg AMB arg AMB val tyr ser trp ala ser leu arg val trp gin 
OPA gly arg arg leu asp ser gly arg cys ile pro gly arg ala cys gly phe gly arq 
721/241 751/251 

gaa cac gat egg cac gtt ggg aaa gec gat ctg caa ttc ggc cag ccc ate ggc gat cgc 
glu his asp arg his val gly lys ala asp leu gin phe gly gin pro ile gly asp arg 
asn thr lie gly thr leu gly lys pro ile cys asn ser ala ser pro ser ala ile ala 
thr arg ser ala arg trp glu ser arg ser ala ile arg pro ala his arg arg ser pro 
781/261 811/271 

cgt egg gcg ggc gaa gga gtg cgc gaa gat etc cga gta gcg gtc etc gac cac cac ggc 
arg arg ala gly glu gly val arg glu asp leu arg val ala val leu asp his his gly 
val gly arg ala lys glu cys ala lys ile ser glu AMB arg ser ser thr thr thr ala 
ser gly gly arg arg ser ala arg arg ser pro ser ser gly pro arg pro pro arq arq 
841/281 871/291 

ggc ccg tgg cag cgc ggc cag ttc ggt cag ttg gta ttt cag gtt gec gtt cag cac gee 
gly pro trp gin arg gly gin phe gly gin leu val phe gin val ala val gin his ala 
ala arg gly ser ala ala ser ser val ser trp tyr phe arg leu pro phe ser thr pro 
pro val ala ala arg pro val arg ser val gly ile ser gly cys arg ser ala arg gin 
901/301 931/311 

aga agt aag gtc cgc caa cgc ttt acg etc gac ggc cgc cac gag ttg gec ggc cac ttt 
arg ser lys val arg gin arg phe thr leu asp gly arg his glu leu ala gly his phe 
glu val arg ser ala asn ala leu arg ser thr ala ala thr ser trp pro ala thr phe 
lys OCH gly pro pro thr leu tyr ala arg arg pro pro arg val gly arg pro leu ser 
961/321 991/331 

cag gec gta gtc gec gca ggg cag ggc ttc ccg cgt cgt ctt cgc ggg ttt gtc ggc aaa 
gin ala val val ala ala gly gin gly phe pro arg arg leu arg gly phe val gly lys 
arg pro AMB ser pro gin gly arg ala ser arg val val phe ala gly leu ser ala lys 
gly arg ser arg arg arg ala gly leu pro ala ser ser ser arg val cys arg gin arq 
1021/341 1051/351 

ggt gta ggg gta gcg ttc gtg ggc gtc gac gac gat gtg cag etc ggg gat gee ggc ggc 
gly val gly val ala phe val gly val asp asp asp val gin leu gly asp ala gly gly 
val AMB gly AMB arg ser trp ala ser thr thr met cys ser ser gly met pro ala ala 

cys arg gly ser val arg gly arg arg arg arg cys ala ala arg gly cys arg arg arq 
1081/361 1111/371 

gcg ggc ggt ggg ggt gcg cac gee egg ccg cga ctg ttt gcg cgt ttt ggg get ctg cca 
ala gly gly gly gly ala his ala arg pro arg leu phe ala arg phe gly ala leu pro 
arg ala val gly val arg thr pro gly arg asp cys leu arg val leu gly leu cys gin 
gly arg trp gly cys ala arg pro ala ala thr val cys ala phe trp gly ser ala arg 
1141/381 1171/391 

gaa cac cac ctg gcg gec gcg cgc cat ggt gtg cac cag ttg cga teg gtt etc ccg cgc 
glu his his leu ala ala ala arg his gly val his gin leu arg ser val leu pro arg 
asn thr thr trp arg pro arg ala met val cys thr ser cys asp arg phe ser arg ala 
thr pro pro gly gly arg ala pro trp cys ala pro val ala ile gly ser pro ala arg 
1201/401 1231/411 

gcg ggc ggc gac gac gtc gat ggc cgc gec ccg gcg get gca get gcg tag etc gac ccg 
ala gly gly asp asp val asp gly arg ala pro ala ala ala ala ala AMB leu asp pro 
arg ala ala thr thr ser met ala ala pro arg arg leu gin leu arg ser ser thr arg 
gly arg arg arg arg arg trp pro arg pro gly gly cys ser cys val ala arq Dro alv 
1261/421 1291/431 * Y 

gtc gac gac gac ggg gtc ggc ggg cca gtc ggc gat gtc gag gcg atg gca ata cag cgc 
val asp asp asp gly val gly gly pro val gly asp val glu ala met ala ile gin arg 
ser thr thr thr gly ser ala gly gin ser ala met ser arg arg trp gin tyr ser ala 
arg arg arg arg gly arg arg ala ser arg arg cys arg gly asp gly asn thr ala pro 



SEQ ID N° 15Q {suite 1) 
FIGURE 15Q (suite 1) 



FEUILLE DE REM PLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



56/185 



1321/441 1351/451 

ctt ggt gcg egg cca cac gtc tga ggt ggc gaa gac cag tec cgc gec cac egg cag ccg 
leu gly ala arg pro his val OPA gly gly glu asp gin ser arg ala his arg gin pro 
leu val arg gly his thr ser glu val ala lys thr ser pro ala pro thr gly ser arg 

trp cys ala ala thr arg leu arg trp arg arg pro val pro arg pro pro ala ala gly 
1381/461 1411/471 

gat cag gta ggg cag gcg cga gtc ttc age ggg gtt ggc ggc gac gag cag etc cac aga 
asp gin val gly gin ala arg val phe ser gly val gly gly asp glu gin leu his arg 
ile arg AMB gly arg arg glu ser ser ala gly leu ala ala thr ser ser ser thr glu 
ser gly arg ala gly ala ser leu gin arg gly trp arg arg arg ala ala pro gin ser 
1441/481 1471/491 

gtg tga ggg tac ggg egg cgt acg gca acg gtg aag cag gca etc cga cga ace cat cgt 
val OPA gly tyr gly arg arg thr ala thr val lys gin ala leu arg arg thr his arg 
cys glu gly thr gly gly val arg gin arg OPA ser arg his ser asp glu pro ile val 

val arg val arg ala ala tyr gly asn gly glu ala gly thr pro thr asn pro ser ser 
1501/501 

cac gtc gaa ggg gca ggt ga 
his val glu gly ala gly 
thr ser lys gly gin val 
arg arg arg gly arg OPA 



SEQ ID N° 15Q (suite 2) 
FIGURE 15Q (suite (2) 



TGC GCA 


TGC 


CGA 


CCA 


cys ala 


cys 


arg 


pro 


61/21 








CGA TAT 


AAC 


CAC 


TCT 


arg tyr 


asn 


his 


ser 


121/41 








CAT GCA 


TTC 


GCG 


ACC 


his ala 


phe 


ala 


thr 


181/61 








GAC TTC 


CGT 


GCC 


GAA 


asp phe 


arg 


ala 


glu 


241/81 








CCT GGC 


AGT 


TGC 


AAG 


pro gly 


ser 


cys 


lys 


301/101 








GCG GCC 


CGA 


GCA 


CCA 


ala ala 


arg 


ala 


pro 


361/121 








GAT GTC 


CGC 


GCT 


ATC 


asp val 


arg 


ala 


ile 



GTG TGG TTG GCC GGA 
val trp leu ala gly 

AGT CAC ATC AAC CAC 
ser his ile asn his 

GCG GGA GCC GGC GAA 
ala gly ala gly glu 

CCG ACG CCG ACG CAA 
pro thr pro thr gin 

TCC TTG TGC ATA TTT 
ser leu cys ile phe 

TGA ATT CAA GCA GGC 
OPA ile gin ala gly 

GCA GGG GTT GTC CCA 
ala gly val val pro 



31/11 








GTT CGT 


TTG 


TTC 


GCG 


val arg 


leu 


phe 


ala 


91/31 








ACT CGT 


ACC 


ATC 


GAG 


thr arg 


thr 


ile 


glu 


151/51 








CCC GGC 


GCC 


ACA 


CAT 


pro gly 


ala 


thr 


his 


211/71 








GCT TTC 


GAC 


AGC 


CAT 


ala phe 


asp 


ser 


his 


271/91 








TCT TGT 


CTA 


CGA 


ATC 


ser cys 


leu 


arg 


ile 


331/111 








GGC GGT 


GTT 


GAC 


CGA 


gly gly 


val 


asp 


arg 


391/131 








GTT CGG 


GAT 


C 




val arg 


asp 







ATT GCC TCA ACG ATT 
ile ala ser thr ile 

CGT GTG GGT TCA TGC 
arg val gly ser cys 

AAT CCA GAT TGA GGA 
asn pro asp OPA gly 

GAG CGC GGT CGC CGC 
glu arg gly arg arg 

AAC CGA AAC GAC CGA 
asn arg asn asp arg 

CCT GCC CGG CGA GCT 
pro ala arg arg ala 



SEQ ID N° 16A 



FIGURE 16A 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



57/185 



GCG CAT GCC GAC 
ala his ala asp 
62/21 

GAT ATA ACC ACT 
asp ile thr thr 
122/41 

ATG CAT TCG CGA 
met his ser arg 
182/61 

ACT TCC GTG CCG 
thr ser val pro 
242/81 

CTG GCA GTT GGA 
leu ala val ala 
302/101 

CGG CCC GAG CAC 
arg pro glu his 
362/121 

ATG TCC GCG CTA 
met ser ala leu 



CAG TGT GGT TGG 
gin cys gly trp 

CTA GTC ACA TCA 
leu val thr ser 

CCG CGG GAG CCG 
pro arg glu pro 

AAC CGA CGC CGA 
asn arg arg arg 

AGT CCT TGT GCA 
ser pro cys ala 

CAT GAA TTC AAG 
his glu phe lys 

TCG CAG GGG TTG 
ser gin gly leu 







32/11 


CCG 


GAG 


TTC GTT 


pro 


glu 


phe val 






92/31 


ACC 


ACA 


CTC GTA 


thr 


thr 


leu val 






152/51 


GCG 


AAC 


CCG GCG 


ala 


asn 


pro ala 






212/71 


CGC 


AAG 


CTT TCG 


arg 


lys 


leu ser 






272/91 


TAT 


TTT 


CTT GTC 


tyr 


phe 


leu val 






332/111 


CAG 


GCG 


GCG GTG 


gin 


ala 


ala val 






392/131 


TCC 


CAG 


TCC GGG 


ser 


gin 


phe gly 



TGT TCG CGA TTG 
cys ser arg leu 

CCA TCG AGC GTG 
pro ser ser val 

CCA CAC ATA ATC 
pro his ile ile 

ACA GCC ATG AGC 
thr ala met ser 

TAC GAA TCA ACC 
tyr glu ser thr 

TTG ACC GAC CTG 
leu thr asp leu 

ATC 
ile 



CCT CAA CGA TTC 
pro gin arg phe 

TGG GTT CAT GCC 
trp val his ala 

CAG ATT GAG GAG 
gin ile glu glu 

GCG GTC GCC GCC 
ala val ala ala 

GAA ACG ACC GAG 
glu thr thr glu 

CCC GGC GAG CTG 
pro gly glu leu 



SEQ ID N° 16B 
FIGURE 16B 



CGC ATG CCG ACC AGT GTG GTT GGC CGG AGT 
arg met pro thr ser val val gly arg ser 
63/21 

ATA TAA CCA CTC TAG TCA CAT CAA CCA CAC 
ile OCH pro leu AMB ser his gin pro his 
123/41 

TGC ATT CGC GAC CGC GGG AGC CGG CGA ACC 
cys ile arg asp arg gly ser arg arg thr 
183/61 

CTT CCG TGC CGA ACC GAC GCC GAC GCA AGC 
leu pro cys arg thr asp ala asp ala ser 
243/81 

TGG CAG TTG CAA GTC CTT GTG CAT ATT TTC 
trp gin leu gin val leu val his ile phe 
303/101 

GGC CCG AGC ACC ATG AAT TCA AGC AGG CGG 
gly pro ser thr met asn ser ser arg arg 
363/121 

TGT CCG CGC TAT CGC AGG GGT TGT CCC AGT 
cys pro arg tyr arg arg gly cys pro ser 



33/11 

TCG TTT GTT CGC GAT TGC CTC AAC GAT TCG 
ser phe val arg asp cys leu asn asD ser 
93/31 

TCG TAC CAT CGA GCG TGT GGG TTC ATG CCA 
ser tyr his arg ala cys gly phe met pro 
153/51 

CGG CGC CAC ACA TAA TCC AGA TTG AGG AGA 
arg arg his thr OCH ser arg leu arg arg 
213/71 

TTT CGA CAG CCA TGA GCG CGG TCG CCG CCC 
phe arg gin pro OPA ala arg ser oro pro 
273/91 

TTG TCT ACG AAT CAA CCG AAA CGA CCG AGC 
leu ser thr asn gin pro lys arg Dro ser 
333/111 

CGG TGT TGA CCG ACC TGC CCG GCG AGC TGA 
arg cys OPA pro thr cys pro ala ser OPA 
393/131 
TCG GGA TC 
ser gly 



SEQ ID N° 16C 
FIGURE 16C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



GCG GGC 


CAC 


CGA 


TCA 


GTC 


GAT 


ala gly 


his 


arg 


ser 


val 


asp 


61/21 












GCA GTG 


ACG 


ACA 


CCA 


GCG 


CAG 


ala val 


thr 


thr 


pro 


ala 


gin 


121/41 












GGC TCG 


CCT 


TTT 


TTT 


CAT 


CAA 


gly ser 


pro 


phe 


phe 


his 


gin 


181/61 












TTC GGT 


CAC 


CTG 


ACG 


GTC 


GGG 


phe gly 


his 


leu 


thr 


val 


gly 


241/81 












TGC CCT 


GCT 


GGT 


GCG 


GCG 


TTC 


cys pro 


ala 


gly 


ala 


ala 


phe 


301/101 












GTC GAT 


GGC 


CCT 


CAA 


CTC 


GGC 


val asp 


gly 


pro 


gin 


leu 


gly 


CGG GCC 


ACC 


GAT 


CAG 


TCG 


ATC 


arg ala 


thr 


asp 


gin 


ser 


ile 


62/21 












CAG TGA 


CGA 


CAC 


CAG 


CGC 


AGG 


gin OPA 


arg 


his 


gin 


arg 


arg 


122/41 












GCT CGC 


CTT 


TTT 


TTC 


ATC 


AAC 


ala arg 


leu 


phe 


phe 


ile 


asn 


182/61 












TCG GTC 


ACC 


TGA 


CGG 


TCG 


GGA 


ser val 


thr 


OPA 


arg 


ser 


gly 


242/81 












GCC CTG 


CTG 


GTG 


CGG 


CGT 


TCG 


ala leu 


leu 


val 


arg 


arg 


ser 


302/101 








TCG ATG 


GCC 


CTC 


AAC 


TCG 


GCA 


ser met 


ala 


leu 


asn 


ser 


ala 



58/185 



31/11 

CGG GTG GTT TCC GCT CCA 
arg val val ser ala pro 
91/31 

GAC GCG CCG TTG GTG TTT 
asp ala pro leu val phe 
151/51 

CGT TGG ACT GCC GCA GTG 
arg trp thr ala ala val 

211/71 
ATG TTC CTT GGG TCT CGG 
met phe leu gly ser arg 

271/91 
GGC CGA GTC GAT CAC CGC 
gly arg val asp his arg 

331/111 
ATC GCG ACT GGC GAT TAT 
ile ala thr gly asp tyr 

SEQ ID N° 17A 
FIGURE 17A 









32/11 




GGG 


TGG 


TTT 


CCG CTC 


CAT 


gly 


trp 


phe 


pro leu 


his 








92/31 




ACG 


CGC 


CGT 


TGG TGT 


TTC 


thr 


arg 


arg 


trp cys 


phe 








152/51 




GTT 


GGA 


CTG 


CCG CAG 


TGG 


val 


gly 


leu 


pro gin 


trp 








212/71 




TGT 


TCC 


TTG 


GGT CTC 


GGG 


cys 


ser 


leu 


gly leu 


gly 








272/91 




GCC 


GAG 


TCG 


ATC ACC 


GCC 


ala 


glu 


ser 


ile thr 


ala 








332/111 




TCG 


CGA 


CTG 


GCG ATT 


ATC 


ser 


arg 


leu 


ala ile 


ile 



SEQ ID N° 17B 
FIGURE 17B 



TCA 


GCC 


CGG 


AAT 


TGA 


GGT 


GCC 


ser 


ala 


arg 


asn 


OPA 


gly 


ala 


ccc 


TCT 


GTT 


GCT 


TTC 


CCG 


TCC 


pro 


ser 


val 


ala 


phe 


pro 


ser 


GCG 


ATG 


TTG 


GTC 


GCC 


GGC 


GTG 


ala 


met 


leu 


val 


ala 


gly 


val 


GTT 


GCT 


GCT 


GGG 


TTT 


GCT 


CAA 


val 


ala 


ala gly 


phe 


ala 


gin 


CAA 


AGA 


GCA 


CCC 


GTT 


AAA 


ACG 


gin 


arg 


ala 


pro 


val 


lys 


thr 


CAC 


CAT 


GCC 


TCG 


GGC 


TGA 


TC 


his 


his 


ala 


ser 


gly 


OPA 




CAG 


CCC 


GGA 


ATT 


GAG 


GTG 


CCG 


gin 


pro 


gly 


ile 


glu 


val 


pro 


CCT 


CTG 


TTG 


CTT 


TCC 


CGT 


CCG 


pro 


leu 


leu 


leu 


ser 


arg 


pro 


CGA 


TGT 


TGG 


TCG 


CCG 


GCG 


TGT 


arg 


cys 


trp 


ser 


pro 


ala 


cys 


TTG 


CTG 


CTG 


GGT 


TTG 


CTC 


AAT 


leu 


leu 


leu 


gly 


leu 


leu 


asn 


AAA 


GAG 


CAC 


CCG 


TTA 


AAA 


CGG 


lys 


glu 


his 


pro 


leu 


lys 


arg 


ACC 


ATG 


CCT 


CGG 


GCT 


GAT 


C 


thr 


met 


pro 


arg 


ala 


asp 





FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



59/185 



GGG CCA 


CCG 


ATC 


AGT 


CGA 


alv pro 


pro 


ile 


ser 


arcr 

M +. *0 


63/21 










AGT GAC 


GAC 


ACC 


AGC 


GCA 


ser asp 


asp 


thr 


ser 


ala 


123/41 










CTC GCC 


TTT 


TTT 


TCA 


TCA 


leu ala 


phe phe 


ser 


ser 


183/61 










CGG TCA 


CCT 


GAC 


GGT 


CGG 


arg ser 


pro 


asp 


gly 


arg 


243/81 










CCC TGC 


TGG 


TGC 


GGC 


GTT 


pro cys 


trp 


cys 


gly 


val 


303/101 










CGA TGG 


CCC 


TCA 


ACT 


CGG 


arg trp 


pro 


ser 


thr 


arg 











33/11 




TCG 


GGT 


GGT 


TTC 


CGC TCC 


ATC 


ser 


qIv 


qIv 


phe 


arg ser 


ile 










93/31 




GGA 


CGC 


GCC 


GTT 


GGT GTT 


TCC 


gly 


arg 


ala 


val 


gly val 


ser 










153/51 




ACG 


TTG 


GAC 


TGC 


CGC AGT 


GGC 


thr 


leu 


asp 


cys 


arg ser 


crl v 










213/71 




GAT 


GTT 


CCT 


TGG 


GTC TCG 


GGT 


asp 


val 


pro 


trp 


val ser 


gly 










273/91 




CGG 


CCG 


AGT 


CGA 


TCA CCG 


CCA 


arg 


pro 


ser 


arg 


ser pro 


pro 










333/111 




CAT 


CGC 


GAC 


TGG 


CGA TTA 


TCA 


his 


arg 


asp 


trp 


arg leu 


ser 



SEQ ID N° 17C 
FIGURE 17C 



AGC CCG GAA TTG AGG TGC CGC 
ser pro glu leu arg cys arg 

CTC TGT TGC TTT CCC GTC CGG 
leu cys cys phe pro val arg 

GAT GTT GGT CGC CGG CGT GTT 
asp val gly arg arg arg val 

TGC TGC TGG GTT TGC TCA ATG 
cys cys trp val cys ser met 

AAG AGC ACC CGT TAA AAC GGT 
lys ser thr arg OCH asn gly 

CCA TGC CTC GGG CTG ATC 
pro cys leu gly leu ile 



partie de la sequence nucleotidique de seq!7A 



1/1 * 31/11 



ggc tag 


aac 


ccc 


gaa 


gga 


gac 


etc 


gcg 


ggt 


tgc egg 


ccc 


ccg 


gec 


cat 


egg 


atg 


cgt 


ate 


gly AMB 


asn 


pro 


glu 


gly 


asp 


leu 


ala 


gly 


cys arg 


pro 


pro 


ala 


his 


arg 


met 


arg 


ile 


61/21 


















91/31 


















egg teg 


cgc 


cga 


ttc 


acg 


acc 


gac 


ata 


ggg 


age cac 


ccc 


ttg 


ggt 


gat 


tec 


ggt 


gcg 


acg 


arg ser 


arg 


arg 


phe 


thr 


thr 


asp 


ile 


gly 


ser tyr 


pro 


leu 


gly 


asp 


ser 


gly 


ala 


thr 


121/41 


















151/51 


















act gcg 


ata 


cgc 


teg 


gcg 


ggc 


cac 


cga 


tea 


gtc gat 


egg 


gtg 


gtt 


tec 


get 


cca 


tea 


gee 


thr ala 


ile 


arg 


ser 


ala 


gly 


his 


arg 


ser 


val asp 


arg 


val 


val 


ser 


ala 


pro 


ser 


ala 


181/61 


















211/71* 
















egg aat 


tga 


ggt 


gec 


gca 


gtg 


acg 


aca 


cca 


gcg cag 


gac 


gcg 


ccg 


ttg 


gtg 


ttt 


ccc 


tct 


arg asn 


OPA 


gly 


ala 


ala 


val 


thr 


thr 


pro 


ala gin 


asp 


ala 


pro 


leu 


val 


phe pro 


ser 


241/81 


















271/91 


















gtt get 


ttc 


cgt 


ccg 


gtt 


cgc 


ctt 


ttt 


ttc 


ate aac 


gtt 


gga 


ctg 


gee 


gca 


gtg 


gcg 


atg 


val ala 


phe 


arg 


pro 


val 


arg 


leu 


phe phe 


ile asn 


val 


gly 


leu 


ala 


ala 


val 


ala 


met 


301/101 


















331/111 


















ttg gtc 


gec 


ggc 


gtg 


ttc 


ggt 


cac 


ctg 


acg 


gtc ggg 


atg 


ttc 


ttg 


ggt 


etc 


ggg 


ttg 


ctg 


leu val 


ala 


gly 


val 


phe 


gly 


his 


leu 


thr 


val gly 


met 


phe 


leu 


gly 


leu 


gly 


leu 


leu 


361/121 


















391/131 
















ctg ggt 


ttg 


etc 


aat 


gec 


ctg 


ctg 


gtg 


egg 


cgt teg 


gec 


gag 


teg 


ate 


acc 


gec 


aaa 


gag 


leu gly leu 


leu 


asn 


ala 


leu 


leu 


val 


arg 


arg ser 


ala 


glu 


ser 


ile 


thr 


ala 


lys 


glu 


421/141 


















451/151 














cac ccg 


tta 


aaa 


egg 


teg 


atg 


gec 


etc 


aac 


teg gca 


teg 


cga 


ctg 


gcg 


att 


ate 


acc 


ate 


his pro 


leu 


lys 


arg 


ser 


met 


ala 


leu 


asn 


ser ala 




arg 


leu 


ala 


ile 


ile 




ile 



481/161 

etc ggg ctg ate 
leu gly leu ile 

SEQ ID N° 17A' 
FEUILLE DE REMpESHIwiE^REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



60/185 



1/1 






get aga 


aec 


ccg 


ala arg 


thr 


pro 


61/21 






ggt cgc 


gee 


gat 


gly arg 


ala 


asp 


121/41 






ctg cga 


tac 


get 


leu arg 


tyr 


ala 


181/61 






gga att 


gag 


gtg 


gly ile 


glu val 


241/81 






ttg ctt 


tec 


gtc 


leu leu 


ser 


val 


301/101 






tgg teg 


ccg 


gcg 


trp ser 


pro 


ala 


361/121 






tgg gtt 


tgc 


tea 


trp val 


cys 


ser 


421/141 






acc cgt 


taa 


aac 


thr arg 


OCH 


asn 


481/161 






teg ggc 


tga 


tc 


ser gly 


OPA 





aag gag acc teg 
lys glu thr ser 

tea cga ccg aca 
ser arg pro thr 

egg egg gee acc 
arg arg ala thr 

ccg cag tga cga 
pro gin OPA arg 

egg ttc gee ttt 
arg phe ala phe 

tgt teg gtc acc 
cys ser val thr 

atg ccc tgc tgg 
met pro cys trp 

ggt cga tgg ccc 
gly arg trp pro 



31/11 
egg gtt gec ggc 
arg val ala gly 

91/31 
tag gga get acc 
AMB gly ala thr 

151/51 
gat cag teg ate 
asp gin ser ile 

211/71 
cac cag cgc agg 
his gin arg arg 

271/91 
ttt tea tea acg 
phe ser ser thr 

331/111 
tga egg teg gga 
OPA arg ser gly 

391/131 
tgc ggc gtt egg 
cys gly val arg 

451/151 
tea act egg cat 
ser thr arg his 



ccc egg ccc ate 
pro arg pro ile 

cct tgg gtg att 
pro trp val ile 

ggg tgg ttt ccg 
gly trp phe pro 

acg cgc cgt tgg 
thr arg arg trp 

ttg gac tgg ccg 
leu asp trp pro 

tgt tct tgg gtc 
cys ser trp val 

ccg agt cga tea 
pro ser arg ser 

cgc gac tgg cga 
arg asp trp arg 



gga tgc gta tec 
gly cys val ser 

ccg gtg cga cga 
pro val arg arg 

etc cat cag ccc 
leu his gin pro 

tgt ttc cct ctg 
cys phe pro leu 

cag tgg cga tgt 
gin trp arg cys 

teg ggt tgc tgc 
ser gly cys cys 

ccg cca aag age 
pro pro lys ser 

tta tea cca tec 
leu ser pro ser 



SEQ ID N° 17B' 



FIGURE 17B' 



1/1 

eta gaa ccc cga agg aga cct cgc ggg ttg 
leu glu pro arg arg arg pro arg gly leu 
61/21 

gtc gcg ccg att cac gac cga cat agg gag 
val ala pro ile his asp arg his arg glu 
121/41 

tgc gat acg etc ggc ggg cca ccg ate agt 
cys asp thr leu gly gly pro pro ile ser 
181/61 

gaa ttg agg tgc cgc agt gac gac acc age 
glu leu arg cys arg ser asp asp thr ser 
241/81 

tgc ttt ccg tec ggt teg cct ttt ttt cat 
cys phe pro ser gly ser pro phe one his 
301/101 

ggt cgc egg cgt gtt egg tea cct gac ggt 
gly arg arg arg val arg ser pro asp gly 
361/121 

ggg ttt get caa tgc cct get ggt gcg gcg 
gly phe ala gin cys pro ala gly ala ala 
421/141 

ccc gtt aaa acg gtc gat ggc cct caa etc 

pro val lys thr val asp gly pro gin leu 

431/161 

egg get gat c 

arg ala asp 



31/11 

ccg gec ccc ggc cca teg gat gcg tat ccg 
pro ala pro gly pro ser asp ala tyr pro 
91/31 

eta ccc ctt ggg tga ttc egg tgc gac gac 
leu pro leu gly OPA phe arg cys asp asp 
151/51 

cga teg ggt ggt ttc cgc tec ate age ccg 
arg ser gly gly phe arg ser ile ser pro 
211/71 

gca gga cgc gee gtt ggt gtt tec etc tgt 
ala gly arg ala val gly val ser leu cys 
271/91 

caa cgt tgg act ggc cgc agt ggc gat gtt 
gin arg trp thr gly arg ser gly asp val 
331/111 

egg gat gtt ctt ggg tct egg gtt get get 
arg asp val leu gly ser arg val ala ala 
391/131 

ttc ggc cga gtc gat cac cgc caa aga gca 
phe gly arg val asp his arg gin arg ala 
451/151 

ggc ate gcg act ggc gat tat cac cat cct 
gly ile ala thr gly asp tyr his his pro 



SEQ ID N° 17C 



FEUILLE DE RENfffcaSSMBWE (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



61/185 



sequence 


i Rvl303 


predite 


par 


Cole et al. 


. (Nature 393:537-54 


SeqlTA* 






















1/1 














31/11 








atg acg 


aca 


cca 


gcg cag 


gac 


gcg 


ccg ttg 


gtg ttt 


ccc 


tct 


gtt 


met thr 


thr 


pro 


ala gin asp 


ala 


pro leu 


val phe 


pro 


ser 


val 


61/21 














91/31 








cgc ctt 


ttt 


ttc 


ate aac 


gtt 


gga 


ctg gcc 


gca gtg 


gcg 


atg 


ttg 


arg leu 


phe phe 


ile asn 


val 


gly leu ala 


ala val 


ala 


met 


leu 


121/41 














151/51 








ggt cac 


ctg 


acg 


gtc ggg 


atg 


ttc 


ttg ggt 


etc ggg 


ttg 


ctg 


ctg 


gly his 


leu 


thr 


val gly met 


phe 


leu gly 


leu gly 


leu 


leu 


leu 


181/61 














211/71 








ctg ctg 


gtg egg 


cgt teg gcc 


gag 


teg ate 


acc gcc 


aaa 


gag 


cac 


leu leu 


val 


arg 


arg ser 


ala 


glu 


ser ile 


thr ala 


lys 


glu 


his 


241/81 














271/91 




atg gcc 


etc 


aac 


teg gca 


teg 


cga 


ctg gcg 


att ate 


acc 


ate 


etc 


met ala 


leu 


asn 


ser ala 


ser 


arg 


leu ala 


ile ile 


thr 


ile 


leu 


301/101 














331/111 








tac att 


ttc 


egg 


ccc get 


gga 


ttg 


ggc gtc 


gtg ttc 


ggg 


ctg 


gca 


tyr ile 


phe 


arg 


pro ala 


gly 


leu gly val 


val phe 


gly 


leu 


ala 


361/121 














391/131 






ctg gtg 


gca 


acg 


acg gcc 


ctg 


ccg 


gtc ctg 


aag aag 


ctg 


cgc 


act 


leu val 


ala 


thr 


thr ala 


leu 


pro 


val leu 


lys lys 


leu 


arg 


thr 


421/141 














451/151 






gtc gca 


act 


tat 


tct tec 


aat 


ggc 


cag ace 


ggg gga 


teg 


gaa 


gga 


val ala 


thr 


tyr 


ser ser 


asn 


gly gin thr 


gly gly 


ser 


glu 


gly 


481/161 


















gac tga 






















asp OPA 























SEQ ID N° 17D 



FIGURE 17D 



Orf d'apres Cole et al. (Nature 393:537-544) et contenant Rvl303 
1/1 31/11 



tga ggt 


gcc 


gca 


gtg 


acg 


aca 


cca 


gcg 


cag 


gac gcg ccg ttg 


gtg 


ttt 


ccc 


tct gtt get 


OPA gly 


ala 


ala 


val 


thr 


thr 


pro ala gin asp ala pro leu 


val 


phe 


pro 


ser val ala 


61/21 


















91/31 








ttc cgt 


ccg 


gtt 


cgc 


ctt 


ttt 


ttc 


ate 


aac 


gtt gga ctg gcc 


gca 


gtg 


gcg 


atg ttg gtc 


phe arg 


pro val 


arg leu phe 


phe 


ile 


asn val gly leu ala 


ala 


val 


ala 


met leu val 


121/41 


















151/51 










gcc ggc 


gtg 


ttc 


ggt 


cac 


ctg 


acg 


gtc 


ggg 


atg ttc ttg ggt 


etc 


ggg 


ttg ctg ctg ggt 


ala gly 


val phe gly his 


leu 


thr val gly met phe leu gly 


leu 


gly 


leu leu leu alv 


181/61 


















211/71 








ttg etc 


aat 


gcc ctg ctg 


gtg 


egg 


cgt 


teg gcc gag teg ate 


acc 


gcc 


aaa 


gag cac ccg 


leu leu 


asn 


ala 


leu 


leu 


val 


arg 


arg 


ser 


ala glu ser ile 


thr 


ala 


lys 


glu hi3 pro 


241/81 


















271/91 






tta aaa 


egg 


teg 


atg 


gcc 


etc 


aac 


teg gca 


teg cga ctg gcg 


att 


ate 


acc 


ate etc ggg 


leu lys 


arg 


ser 


met 


ala 


leu 


asn 


ser 


ala 


ser arg leu ala 


ile 


ile 


thr 


ile leu gly 


301/101 


















331/111 








ctg ate 


ate 


gcc 


tac 


att 


ttc 


egg 


ccc 


get 


gga ttg ggc gtc 


gtg 


ttc 


ggg 


ctg gca ttc 


leu ile 


ile 


ala 


tyr 


ile 


phe 


arg 


pro 


ala 


gly leu gly val 


val 


phe 


gly leu ala phe 


361/121 


















391/131 










ttc cag 


gtg 


ctg 


ctg 


gtg 


gca 


acg 


acg 


gcc 


ctg ccg gtc ctg 


aag 


aag 


ctg 


cgc act gcg 


phe gin 


val 


leu 


leu 


val 


ala 


thr 


thr 


ala 


leu pro val leu 


lys 


lys 


leu 


arg thr ala 


421/141 


















451/151 






acc gag 


gaa 


ccg 


gtc 


gca 


act 


tat 


tct 


tec 


aat ggc cag acc 


ggg 


gga 


teg 


gaa gga agg 


thr glu 


glu pro val 


ala 


thr 


tyr 


ser 


ser 


asn gly gin thr 


gly 


gly 


ser 


glu gly arg 


481/161 


























age gcc 


age 


gat 


gac 


tga 




















ser ala 


ser 


asp 


asp 


OPA 





















SEQ ID N° 17F 



FEU1LLE DE RENfPL<KGEM&NT(REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



62/185 



GTC GAA CAG GTA CGG AAG GCG 
val glu gin val arg lys ala 
61/21 

AGC CAG CGG CCG TTA ACG TGG 
ser gin arg pro leu thr trp 
121/41 

TGG CTC AGG TCG ATA CCC GAG 
trp leu arg ser ile pro glu 
181/61 

TCG GGT GCA ACG ATC GGG CCA 
ser gly ala thr ile gly pro 
241/81 

ATG CGG AAG ACG ACT CGC GGC 
met arg lys thr thr arg gly 
301/101 

CAG CCG GTC CCG ATG TTC TCG 
gin pro val pro met phe ser 
361/121 

GTC GCC GCG GTC GTG CTG GGT 
val ala ala val val leu gly 













CCG 


TCG 


GTC 


GCT CGG 


TCP 


pro 


ser 


v ax 


A 1 s> a rn 
ala ai(j 


ser 








91/31 




CCG 


AAC 


AGG 


TCG TCT 


TGG 


pro 


asn 


arg 


ser ser 


tro 








151/51 




GGG 


ATG 


GCA 


AGT GTC 


ACC 


gly met 


ala 


ser val 


thr 








211/71 




TGC 


CTG 


ACG 


GGG AGC 


AGA 


cys 


leu 


thr 


gly ser 


a rg 








^ f 1/ y i 




CCG 


ACG 


CCG 


CGG AGG 


CCG 


pro 


thr 


pro 


arg arg 


pro 








331/111 




ACC 


TAC 


GGT 


ATC GCC 


TCG 


thr 


tyr 


gly 


ile ala 


ser 


GCG 


ATG 


ATC 






ala 


met 


ile 







SEQ ID N° 18A 
FIGURE 18A 



GCT GGT ATC TCG TGT TCA GCC 
ala gly ile ser cys ser ala 

GGT CGG GCA TCA GCG TCG ATG 
gly arg ala ser ala ser met 

CCG CCA TCC TTC CAC CTC TTT 
pro pro ser phe his leu phe 

GCC AGC CAC CGG CCC AAG AAG 
ala ser his arg pro lys lys 

CCG CGG CCG AAC CCA AAT CAT 
pro arg pro asn pro asn his 

ACA CTA CTC GGC GTG CTA TCG 
thr leu leu gly val leu ser 



TCG AAC AGG TAC GGA AGG CGC CGT CGG TCG 
ser asn arg tyr gly arg arg arg arg ser 
62/21 

GCC AGC GGC CGT TAA CGT GGC CGA ACA GGT 
ala ser gly arg OCH arg gly arg thr gly 
122/41 

GGC TCA GGT CGA TAC CCG AGG GGA TGG CAA 
gly ser gly arg tyr pro arg gly trp gin 
182/61 

CGG GTG CAA CGA TCG GGC CAT GCC TGA CGG 
arg val gin arg ser gly his ala OPA arg 
242/81 

TGC GGA AGA CGA CTC GCG GCC CGA CGC CGC 
cys gly arg arg leu ala ala arg arg arg 
302/101 

AGC CGG TCC CGA TGT TCT CGA CCT ACG GTA 
ser arg ser arg cys ser arg pro thr val 
362/121 

TCG CCG CGG TCG TGC TGG GTG CGA TGA TC 
ser pro arg ser cys trp val arg OPA 



32/11 

CTC GGT CCG CTG GTA TCT CGT GTT CAG CCA 
leu gly pro leu val ser arg val gin pro 
92/31 

CGT CTT GGG GTC GGG CAT CAG CGT CGA TGT 
arg leu gly val gly his gin arg arg cys 
152/51 

GTG TCA CCC CGC CAT CCT TCC ACC TCT TTT 
val ser pro arg his pro ser thr ser phe 
212/71 

GGA GCA GAG CCA GCC ACC GGC CCA AGA AGA 
gly ala glu pro ala thr gly pro arg arg 
272/91 

GGA GGC CGC CGC GGC CGA ACC CAA ATC ATC 
gly gly arg arg gly arg thr gin ile ile 
332/111 

TCG CCT CGA CAC TAC TCG GCG TGC TAT CGG 
ser pro arg his tyr ser ala cys tyr arg 



SEQ ID N° 18B 



FIGURE 18B 
FEUILLE DE REMPLACEMENT (RE6LE 26) 



WO 99/09186 



PCT/FR98/01813 



63/185 



3/1 

CGA ACA GGT ACG GAA GGC GCC 
arg thr gly thr glu gly ala 
63/21 

CCA GCG GCC GTT AAC GTG GCC 
pro ala ala val asn val ala 
123/41 

GCT CAG GTC GAT ACC CGA GGG 
ala gin val asp thr arg gly 
183/61 

GGG TGC AAC GAT CGG GCC ATG 
gly cys asn asp arg ala met 
243/81 

GCG GAA GAC GAC TCG CGG CCC 
ala glu asp asp ser arg pro 
303/101 

GCC GGT CCC GAT GTT CTC GAC 
ala gly pro asp val leu asp 
363/121 

CGC CGC GGT CGT GCT GGG TGC 
arg arg gly arg ala gly cys 









33/ 1 1 




GTC 


GGT 


CGC 


TCG GTC 


CGC 


val 


gly arg 


ser val 


a rg 








y3/ 3i. 




GAA 


CAG 


GTC 


(jIL 1TG 


GGG 


glu 


gin 


val 


val leu 


gly 








lo3/ 51 




GAT 


GGC 


AAG 


1 GT CAC 


CCC 


asp gly lys 


cys his 


pro 








213/71 




CCT 


GAC 


GGG 


GAG CAG 


AGC 


pro 


asp 


gly 


glu gin 


ser 








273/91 




GAC 


GCC 


GCG 


GAG GCC 


GCC 


asp 


ala 


ala 


glu ala 


ala 








333/111 




CTA 


CGG 


TAT 


CGC CTC 


GAC 


leu 


arg 


tyr 


arg leu 


asp 


GAT 


GAT 


C 






asp 


asp 









SEQ ID N° 18C 
FIGURE 18C 



TGG TAT CTC GTG TTC AGC CAG 
trp tyr leu val phe ser gin 

TCG GGC ATC AGC GTC GAT GTG 
ser gly ile ser val asp val 

GCC ATC CTT CCA CCT CTT TTC 
ala ile leu pro pro leu phe 

CAG CCA CCG GCC CAA GAA GAT 
gin pro pro ala gin glu asp 

GCG GCC GAA CCC AAA TCA TCA 
ala ala glu pro lys ser ser 

ACT ACT CGG CGT GCT ATC GGT 
thr thr arg arg ala ile gly 



partie de la sequence nucleotidique de seqlSA 
1/1 . 31/11 



GAA GGC 


GCC 


GTC 


GGT 


CGC 


TCG 


GTC 


CGC 


TGG 


TAT CTC 


GTG 


TTC 


AGC 


CAG 


CCA 


GCG 


GCC 


GTT 


glu gly 


ala 


val 


gly 


arg 


ser 


val 


arg 


trp 


tyr leu 


val 


phe 


ser 


gin 


pro 


ala 


ala 


val 


61/21 


















91/31 


















AAC GTG 


GCC 


GAA 


CAG 


GTC 


GTC 


TTG 


GGG 


TCG 


GGC ATC 


AGC 


GTC 


GAT 


GTG 


GCT 


CAG 


GTC 


GAT 


asn val 


ala 


glu 


gin 


val 


val 


leu 


gly 


ser 


gly ile 


ser 


val 


asp 


val 


ala 


gin 


val 


asp 


121/41 


















151/51 














ACC CGA 


GGG 


GAT 


GGC 


AAG 


TGT 


CAC 


CCC 


GCC 


ATC CTT 


CCA 


CCT 


CTT 


TTC 


GGG 


TGC 


AAC 


GAT 


thr arg 


gly 


asp 


gly 


lys 


cys 


his 


pro 


ala 


ile leu 


pro 


pro leu phe gly cys 


asn 


asp 


181/61 


















211/71 
















CGG GCC 


ATG 


CCT 


GAC 


GGG 


GAG 


CAG 


AGC 


CAG 


CCA CCG 


GCC 


CAA 


GAA 


GAT 


GCG 


GAA 


GAC 


GAC 


arg ala 


met 


pro 


asp 


gly 


glu 


gin 


ser 


gin 


pro pro 


ala 


gin 


glu 


asp 


ala 


glu 


asp 


asp 


241/81 


















271/91 
















TCG CGG 


CCC 


GAC 


GCC 


GCG 


GAG 


GCC 


GCC 


GCG 


GCC GAA 


CCC 


AAA 


TCA 


TCA 


GCC 


GGT 


CCG 


ATG 


ser arg 


pro 


asp 


ala 


ala 


glu 


ala 


ala 


ala 


ala glu 


pro 


lys 


ser 


ser 


ala 


gly pro 


met 


301/101 


















331/111 


















TTC TCG 


ACC 


TAC 


GGT 


ATC 


GCC 


TCG 


ACA 


CTA 


CTC GGC 


GTG 


CTA 


TCG 


GTC 


GCC 


GCG 


GTC 


GTG 


phe ser 


thr 


tyr 


gly 


ile 


ala 


ser 


thr 


leu 


leu gly 


val 


leu 


ser 


val 


ala 


ala 


val 


val 



361/121 

CTG GGT GCG ATG ATC 
leu gly ala met ile 

SEQ ID N° 18A' 
FIGURE 18A' 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



64/185 



1/1 














ji/ ii 
















CGG AAG GCG CCG 


TCG 


GTC 


GCT 


CGG 


TCC 


GCT 


GGT ATC 


TPG 


TGT 




C1CT 




CAG CGG 


CCG 


arg lys ala pro 


ser 


val 


ala 


arg 


s er 


ala 


gly ile 


ear 
3C1 




ser 


ala 


ser 


gin arg pro 


61/21 














31/ Ji 
















TTA ACG TGG CCG 


AAC 


AGG 


TCG 


TCT 


TGG 


GGT 


CGG GCA 


TCA 


gpg 










TCG 


leu thr trp pro 


asn 


arg 


ser 


ser 




yiy 


oiy aid 


ser 


Ola 


ser 


met 


trp 


1am a >*rt 
icu a l. y 


ser 


121/41 














1 SI /SI 

X ■J X / Jl 












ATA CCC GAG GGG 


ATG 


GCA 


AGT 


GTC 


ACC 


CCG 


CCA TCC 


TTC 


CAC 


CTC 


mmm 
ill 




GGT GCA 


ACG 


ile pro glu gly met ala 


ser 


val 


thr 


pro 


pro ser 


phe 


his 


leu 


phe 


ser 


gly ala 


thr 


181/61 














211/71 














ATC GGG CCA TGC 


CTG 


ACG 


GGG 


AGC 


AGA 


GCC 


AGC CAC 


CGG 


CCC 


AAG 


AAG 


ATG 


CGG AAG 


ACG 


ile gly pro cys 


leu 


thr 


gly 


ser 


arg 


ala 


ser his 


arg 


pro 


lys 


lys 


met 


arg lys 


thr 


241/81 














271/91 














ACT CGC GGC CCG 


ACG 


CCG 


CGG 


AGG 


CCG 


CCG 


CGG CCG 


AAC 


CCA 


AAT 


CAT 


CAG 


CCG GTC 


CGA 


thr arg gly pro 


thr 


pro 


arg 


arg 


pro 


pro 


arg pro 


asn 


pro 


asn 


his 


gin 


pro val 


arg 


301/101 














331/111 










TGT TCT CGA CCT 


ACG 


GTA 


TCG 


CCT 


CGA 


CAC 


TAC TCG 


GCG 


TGC 


TAT 


CGG 


TCG 


CCG CGG 


TCG 


cys ser arg pro 


thr 


val 


ser 


pro 


arg 


his 


tyr ser 


ala 


cys 


tyr 


arg 


ser 


pro arg 


ser 



361/121 
TGC TGG GTG CGA TGA TC 
cys trp val arg OPA 



SEQ ID N° 18B' 
FIGURE 18B' 



1/1 














31/11 


















GGA AGG 


CGC 


CGT CGG TCG 


CTC 


GGT 


CCG 


CTG 


GTA TCT 


CGT 


GTT 


CAG 


CCA 


GCC 


AGC 


GGC 


CGT 


gly arg 


arg 


arg arg ser 


leu 


gly 


pro 


leu 


val ser 


arg 


val 


gin 


pro 


ala 


ser 


gly 


arg 


61/21 














91/31 














TAA CGT 


GGC 


CGA ACA GGT 


CGT 


CTT 


GGG 


GTC 


GGG CAT 


CAG 


CGT 


CGA 


TGT 


GGC 


TCA 


GGT 


CGA 


OCH arg gly 


arg thr gly 


arg 


leu 


gly 


val 


gly his 


gin 


arg 


arg 


cys 


gly 


ser 


gly 


arg 


121/41 














151/51 












TAC CCG 


AGG 


GGA TGG CAA 


GTG 


TCA 


CCC 


CGC 


CAT CCT 


TCC 


ACC 


TCT 


TTT 


CGG 


GTG 


CAA 


CGA 


tyr pro 


arg gly trp gin 


val 


ser 


pro 


arg 


his pro 


ser 


thr 


ser 


phe 


arg 


val 


gin 


arg 


181/61 














211/71 












TCG GGC 


CAT 


GCC TGA CGG 


GGA 


GCA 


GAG 


CCA 


GCC ACC 


GGC 


CCA 


AGA 


AGA 


TGC 


GGA 


AGA 


CGA 


ser gly his 


ala OPA arg gly 


ala 


glu 


pro 


ala thr 


gly pro 


arg 


arg 


cys 


gly 


arg 


arg 


241/81 














271/91 












CTC GCG 


GCC 


CGA CGC CGC 


GGA 


GGC 


CGC 


CGC 


GGC CGA 


ACC 


CAA 


ATC 


ATC 


AGC 


CGG 


TCC 


GAT 


leu ala 


ala 


arg arg arg 


gly 


gly 


arg 


arg 


gly arg 


thr 


gin 


ile 


ile 


ser 


arg 


ser 


asp 


301/101 














331/111 














GTT CTC 


GAC 


CTA CGG TAT 


CGC 


CTC 


GAC 


ACT 


ACT CGG 


CGT 


GCT 


ATC 


GGT 


CGC 


CGC 


GGT 


CGT 


val leu 


asp 


leu arg tyr 


arg 


leu 


asp 


thr 


thr arg 


arg 


ala 


ile 


gly arg 


arg 


sly 


arg 



361/121 
GCT GGG TGC GAT GAT C 
ala gly cys asp asp 

SEQ ID N° 18C 
FIGURE 18C f 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



65/185 



sequence Rv0199 pr^dite par Cole et al. (Nature 393:537-544) et contenant 
seql8A' 

1/1 31/11 



atg cct 


gac 


ggg 


gag 


cag 


age 


cag 


cca 


ccg 


gcc caa 


gaa 


gat 


gcg 


gaa 


gac 


gac 


teg 


egg 


Met pro 


asp 


gly glu 


gin 


ser 


gin pro 


pro 


aia gin 


glu 


asp 


ala 


glu 


asp 


asp 


ser 


arg 


61/21 


















y 1/ j i 










ccc gac 


gcc 






gcc 


gcc 


gcg 


gcc 


gaa 


ccc aaa 


tea 


tea 


gcc 


ggt 


ccg 


atg 


ttc 


teg 


pro asp 


ala 


aid 


glu 


a j. a 


ala 

aia 


ala 


ala 


gxu 


pro lys 


ser 


ser 


ala 


gly 


pro 


met 


phe 


ser 


121/41 


















131/ Dl 
















acc tac 


ggt 


ate 


gcc 


teg 


aca 


eta 


etc 


ggc 


gtg eta 


teg 


gtc 


gcc 


gcg 


gtc 


gtg 


ctg 


ggt 


thr tyr gly 


lie 


ala 

aid 


ser 


thr 


leu 


leu 


gly 


val leu 


ser 


val 


ala 


ala 


val 


val 


leu 


gly 


1 pi /CI 
10 1/ Ol 


















^11/ fx 
















gcg dtv} 




^yg 




gca 


cac 


cgc 


gat 


gac 


tec ggc 


gag 


cgt 


acc 


tac 


ctg 


acc 


egg 


gtc 


ala met 


ile 


trp 


ser 


aia 


his 


arg 


asp 


asp 


ser gly 


_ i « . 
glu 


arg 


thr 


tyr 


leu 


thr 


arg 


val 


241/81 


















£. / 1/ y i 
















atg ctg 


acc 


y ^ 


y t-. c 


gaa 


tgg 


acg 


gcc 


gtg 


ctg ate 


aac 


atg 


aac 


gcc 


gac 


aac 


ate 


gat 


met leu 


thr 


aia 


did 


glu 


trp 


thr 


ala 


val 


leu ile 


asn 


met 


asn 


ala 


asp 


asn 


ile 


asp 


301/101 


















jjI/ 111 














gcc age 


ctg 


can 
c Ct 




ctg 


cac 


gac 


gga 


acg 


gtc ggt 


caa 


etc 


aac 


acc 


gac 


ttc 


gac 


get 


ala ser 


leu 


crln 


arc 


leu 


his 


asp gly 


tnr 


val gly 


gin 


leu 


asn 


thr 


asp phe 


asp 


ala 


361/121 


















391/ lol 
















gtc gtg 


cag 


ccc 


tac 


can 
*-y y. 


cag 


gtg 


gtg 


nan 
y«*y 


Afl n 1~ t* rr 
aau c l. y 


egg 


a eg 


cac 


age 


age 


ggc 


agg 


acc 


val val 


gin 


pro 


tyr 


arg 


gin val 


val 


glu 


lys leu 


arg 


thr 


his 


ser 


ser 


gly 


arg 


ile 


421/141 


















451/151 














gag gcg 


gta 


gcg 


ate 


gat 


acg 


gtg 


cac 


cgc 


gag ctg 


gat 


acc 


cag 


tec 


ggt 


gcc 


gcc 


cga 


glu ala 


val 


ala 


ile 


asp 


thr 


val 


his 


arg 


glu leu 


asp 


thr 


gin 


ser 


gly 


ala 


ala 


arg 


481/161 


















511/171 
















ccg gta 


gta 


acc 


acg 


aaa 


ttg 


cca 


ccg 


ttt 


gcc act 


cgc 


acc 


gac 


teg 


gtg 


ctg 


ctg 


gtc 


pro val 


val 


thr 


thr 


lys 


leu 


pro 


pro 


phe 


ala thr 


arg 


thr 


asp 


ser 


val 


leu 


leu 


val 


541/181 


















571/191 
















gcg acg 


teg 


gtc 


agt 


gag 


aac 


gcc 


ggc 


gcc 


aaa ccc 


cag 


acc 


gtg 


cac 


tgg 


aac 


ttg 


egg 


ala thr 


ser 


val 


ser 


glu 


asn 


ala 


gly 


ala 


lys pro 


gin 


thr 


val 


his 


trp 


asn 


leu 


arg 


601/201 


















631/211 














etc gat 


gtc 


tec 


gat 


gtg 


gac 


ggc 


aag 


ctg 


atg ate 


tec 


egg 


ttg 


gag 


teg 


att 


cga 


tga 


leu asp 


val 


ser 


asp 


val 


asp gly lys 


leu 


met ile 


ser 


arg 


leu 


glu 


ser 


ile 


arg 


OPA 



SEQ ID N° 18D 
FIGURE 18D 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



66/185 



ORF d'apres Cole et al. (Nature 393:537-544) et contenant Rv0199 

1/1 31/11 

taa tec gat gec gga ttg ggt gaa atg cac caa gta acg ggt cga gtc ttt gga ate ggt 

OCH ser asp ala gly leu gly glu met his gin val thr gly arg val phe gly ile glv 

61/21 9 1/31 

ate gac ata gac tec gat gec gee gec cac gec ggc acg ttg cag agt gec aag ggc ggc 

lie asp ile asp ser asp ala ala ala his ala gly thr leu gin ser ala lys glv glv 

121/41 151/51 

ggc caa ttc ggt ggc gtc ggc cgc get gtc aat cgt ggc caa ttc gtc gtg cag egg ttg 

gly gin phe gly gly val gly arg ala val asn arg gly gin phe val val gin arc leu 

181/61 211/71 * 

cac ccc tgc gcg etc gac ggc ttc etc gtc gag gaa get ggc gta gag gtc gec gat gcg 

his pro cys ala leu asp gly phe leu val glu glu ala gly val glu val ala asp ala 

241/81 271/91 

ctg cgc ate ggt gec tac cgc age acc tgc ttg get ggc ctg gat gat cag gtc teg cac 

9ly ala tyr arg 3er thr Cys leu ala * y leu asp asp gin val ser his 
301/101 331/111 

ttg tgt etc ggc gcg gtc gaa cag get acg gaa ggc gec gtc ggt cgc teg gtc cgc tag 

leu cys leu gly ala val glu gin ala thr glu gly ala val gly arg ser val arg trp 
361/121 391/131 

tat etc gtg ttc age cag cca gcg gee gtt aac gtg gec gaa cag gtc gtc ttg ggg teg 

tyr leu val phe ser gin pro ala ala val asn val ala glu gin val val leu glv ser 
421/141 451/151 

ggc ate age gtc gat gtg get cag gtc gat acc cga ggg gat ggc aag tgt cac ccc gee 

Val aSP Val ala gln Val a3p thr arg 9ly asp gly lys cys his pro ala 
481/161 511/171 

ate ctt cca cct ctt ttc ggg tgc aac gat egg gee atg cct gac ggg gag cag age cag 

cT?i! U Pr ° Pr ° leU Phe gly Cys a3n asp ar< * ala met P ro as P 91/ glu gin ser gin 
541/181 571/191 

cca ccg gee caa gaa gat gcg gaa gac gac teg egg ccc gac gec gcg gag gec gee gcg 

ala gln 9lU a3p ala glu a3p asp 3er ar 9 P ro a3 P aia aia gl« ala ala ala 
601/201 631/211 

gec gaa ccc aaa tea tea gec ggt ccg atg ttc teg acc tac ggt ate gec teg aca eta 
ala glu pro lys ser ser ala gly pro met phe ser thr tyr gly ile ala ser thr leu 
661/221 691/231 

etc ggc gtg eta teg gtc gec gcg gtc gtg ctg ggt gcg atg ate tgg tec gca cac cgc 
leu gly val leu ser val ala ala val val leu gly ala met ile trp ser ala his arg 
721/241 751/251 

gat gac tec ggc gag cgt acc tac ctg acc egg gtc atg ctg acc gec get gaa tgg acg 
asp asp ser gly glu arg thr tyr leu thr arg val met leu thr ala ala glu trp thr 
781/261 811/271 

gec gtg ctg ate aac atg aac gec gac aac ate gat gec age ctg cag cga ctg cac gac 

!:! ,Y al leu lle a3n met asn ala asp asn ile a3 P aia ser ^u gln arg leu his asp 
841/281 871/291 

gga acg gtc ggt caa etc aac acc gac ttc gac get gtc gtg cag ccc tac egg cag gtg 

gly thr val gly gln leu asn thr asp phe asp ala val val gln pro tyr arg gln val 
901/301 931/311 

gtg gag aag ttg egg acg cac age age ggc agg ate gag gcg gta gcg ate gat acg gtg 

lyS l€U arg thr hi3 Ser 3er gly arg ile * lu ala vaX aia iie aso thr val 
961/321 991/331 

cac cgc gag ctg gat acc cag tec ggt gee gec cga ccg gta gta acc acg aaa ttg cca 
his arg glu leu asp thr gln ser gly ala ala arg pro val val thr thr lys leu Dro 
1021/341 1051/351 

ccg ttt gee act cgc acc gac teg gtg ctg ctg gtc gcg acg teg gtc agt gag aac gec 
pro phe ala thr arg thr asp ser val leu leu val ala thr ser val ser glu asn ala 
1081/361 1111/371 

ggc gec aaa ccc cag acc gtg cac tgg aac ttg egg etc gat gtc tec gat gtg gac ggc 
gly ala lys pro gln thr val his trp asn leu arg leu asD val ser aso val asp alv 
1141/381 1171/391 * * 

aag ctg atg ate tec egg ttg gag teg att cga tga 
lys leu met ile ser arg leu glu ser ile arg OPA 

SEQ ID N° 18F 



FIGURE 18F 
FEUILLE DE REM PLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



67/185 



GTT GCG CAA CGG GGT GAG CAC 
val ala gin arg gly glu his 
61/21 

CGC CAA CGC CAA CGA CGG CAC 
arg gin arg gin arg arg his 
121/41 

CTA TGT GGT AAA CAC ACT GCG 
leu cys gly lys his thr ala 
181/61 

TCG CGT GTT CAA GGC CGA AAA 
ser arg val gin gly arg lys 
241/81 

GGC GCT CGA GTA CAG CCT CGG 
gly ala arg val gin pro arg 
301/101 

CCC CGC CGA CGA CAG TCC GGG 
pro arg arg arg gin ser gly 
361/121 

TGC GGT GGT GCT GGT AGA TC 
cys gly gly ala gly arg 









j1/ 11 






rrr 


PAT 






arg 


arg 


asp 


asp gly 


aia 








gi 




TCG 


CGC 




ric.fi p ?\ p 


rrr 


ser 


arg 


gly 


/*f Iff U 1 A 

giy nis 


pro 








1ST /si 

X<J 1/ Jl 




CAA 


CAG 




111 i GA 


TGT 


gin 


gin 


arg 


w% Vs a f*\ T") TV 

pne UrA 


cys 








£. ± ± / I X 




AGG 


GGT 


GGT 


GAC CCT 


CGG 


arg gly 


gly 


asp pro 


arg 








271/91 




CAC 


ACC 


GCC 


GGA CGG 


GGT 


his 


thr 


ala 


gly arg 


gly 








331/111 




CTG 


CAG 


TCC 


GTC GGA 


CTA 


leu 


gin 


ser 


val gly 


leu 



SEQ ID N° 19A 
FIGURE 19A 



ACT ATC GAA ACT GCA GGA CAT 
thr ile glu thr ala gly his 

TGG CTA TCA GGC CAG CGT CGA 
trp leu ser gly gin arg arg 

GCA AAC CCC GGA GTT CTC CGC 
ala asn pro gly val leu arg 

CGG CAA CAC CGT GGA GGC GAG 
arg gin his arg gly gly glu 

GAC GGG CCC GCT GGT GGC TGC 
asp gly pro ala gly gly cys 

CGA CAG GCT GCC GGT GTC CGG 
arg gin ala ala gly val arg 



TTG CGC AAC GGG GTG AGC ACC 
leu arg asn .gly val ser thr 
62/21 

GCC AAC GCC AAC GAC GGC ACT 
ala asn ala asn asp gly thr 
122/41 

TAT GTG GTA AAC ACA CTG CGC 
tyr val val asn thr leu arg 
182/61 

CGC GTG TTC AAG GCC GAA AAA 
arg val phe lys ala glu lys 
242/81 

GCG CTC GAG TAC AGC CTC GGC 
ala leu glu tyr ser leu gly 
302/101 

CCC GCC GAC GAC AGT CCG GGC 
pro ala asp aso ser pro gly 
362/121 

GCG GTG GTG CTG GTA GAT C 
ala val val leu val asp 









32/11 




GAC 


GCG 


ATG 


ATG GCG 


CAA 


asp 


ala 


met 


met aia 


gin 








92/31 




CGC 


GCG 


GTG 


GGC ACC 


CCT 


arg 


ala 


val 


gly thr 


pro 








152/51 




AAC 


AGC 


GGT 


TTT GAT 


GTG 


asn 


ser 


gly 


phe asp 


val 








212/71* 




GGG 


GTG 


GTG 


ACC CTC 


GGC 


gly val 


val 


thr leu 


gly 








272/91 




ACA 


CCG 


CCG 


GAC GGG 


GTG 


thr 


pro 


pro 


asp gly 


val 








332/111 




TGC 


AGT 


CCG 


TCG GAC 


TAC 


cys 


ser 


pro 


ser asp 


tyr 



SEQ ID N° 19B 
FIGURE 19B 



CTA TCG AAA CTG CAG GAC ATC 
leu ser lys leu gin asp ile 

GGC TAT CAG GCC AGC GTC GAC 
gly tyr gin ala ser val asp 

CAA ACC CCG GAG TTC TCC GCT 
gin thr pro glu phe ser ala 

GGC AAC ACC GTG GAG GCG AGG 
gly asn thr val glu ala arg 

ACG GGC CCG CTG GTG GCT GCC 
thr gly pro leu val ala ala 

GAC AGG CTG CCG GTG TCC GGT 
asp arg leu pro val ser gly 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



68/185 



TGC GCA ACG GGG TGA GCA CCG 
cys ala thr gly OPA ala pro 
63/21 

CCA ACG CCA ACG ACG GCA CTC 
pro thr pro thr thr ala leu 
123/41 

ATG TGG TAA ACA CAC TGC GCA 
met trp OCH thr his cys ala 
183/61 

GCG TGT TCA AGG CCG AAA AAG 
ala cys ser arg pro lys lys 
243/81 

CGC TCG AGT ACA GCC TCG GCA 
arg ser ser thr ala ser ala 
303/101 

CCG CCG ACG ACA GTC CGG GCT 
pro pro thr thr val arg ala 
363/121 

CGG TGG TGC TGG TAG ATC 
arg trp cys trp AMB ile 









33/11 




ACG 


CGA 


TGA 


TGG CGC 


AAC 


thr 


arg 


OPA 


trp arg 


asn 








93/31 




GCG 


CGG 


TGG 


GCA CCC 


CTG 


ala 


arg 


trp 


ala pro 


leu 








lb J/ 51 




ACA 


GCG 


GTT 


TTG ATG 


TGC 


thr 


ala 


val 


leu met 


cys 








01 1 /*7 1 
£. 1 J/ IX. 




GGG 


TGG 


TGA 


CCC TCG 


GCG 


gly trp 


OPA 


pro ser 


ala 








273/91 




CAC 


CGC 


CGG 


ACG GGG 


TGA 


his 


arg 


arg 


thr gly 


OPA 








333/111 




GCA 


GTC 


CGT 


CGG ACT 


ACG 


ala 


val 


arg 


arg thr 


thr 



SEQ ID N° 19C 
FIGURE 19C 



TAT CGA AAC TGC AGG ACA TCG 
tyr arg asn cys arg thr ser 

GCT ATC AGG CCA GCG TCG ACT 
ala ile arg pro ala ser thr 

AAA CCC CGG AGT TCT CCG CTC 
lys pro arg ser ser pro leu 

GCA ACA CCG TGG AGG CGA GGG 
ala thr pro trp arg arg gly 

CGG GCC CGC TGG TGG CTG CCC 
arg ala arg trp trp leu pro 

ACA GGC TGC CGG TGT CCG GTG 
thr gly cys arg cys pro val 



partie de la sequence nucleotidique de seq!9A 
1/1 31/11 

CTA TCG AAA CTG CAG GAC ATC GCC AAC GCC AAC GAC GGC ACT CGC GCG GTG GGC ACC CCT 
leu ser lys leu gin asp ile ala asn ala asn asp gly thr arg ala val gly thr pro 
61/21 91/31 

GGC TAT CAG GCC AGC GTC GAC TAT GTG GTA AAC ACA CTG CGC AAC AGC GGT TTT GAT GTG 
gly tyr gin ala ser val asp tyr val val asn thr leu arg asn ser gly phe asp val 
121/41 151/51 

CAA ACC CCG GAG TTC TCC GCT CGC GTG TTC AAG GCC GAA AAA GGG GTG GTG ACC CTC GGC 
gin thr pro glu phe ser ala arg val phe lys ala glu lys gly val val thr leu gly 
181/61 211/71 

GGC AAC ACC GTG GAG GCG AGG GCG CTC GAG TAC AGC CTC GGC ACA CCG CCG GAC GGG GTG 
gly asn thr val glu ala arg ala leu glu tyr ser leu gly thr pro pro asp gly val 
241/81 271/91 

ACG GGC CCG CTG GTG GCT GCC CCC GCC GAC GAC AGT CCG GGC TGC AGT CCG TCG GAC TAC 

thr gly pro leu val ala ala pro ala asp asp ser pro gly cys ser pro ser asp tyr 

301/101 331/111 

GAC AGG CTG CCG GTG TCC GGT GCG GTG GTG CTG GTA GAT C 

asp arg leu pro val ser gly ala val val leu val asp 



SEQ ID N° 19A f 



FIGURE 19A 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



69/185 



1/1 

A/ X 
















?1 / 1 1 


















TAT CGA AAC 


TGC 


AGG 


ACA 


TCG 


CCA 


ACG 


CCA 


ACG ACG 




CTC 


(ZCCZ 


CGG 


TGG 


GCA 




W lvj 


tyr arg asn 


cys 


arg 


thr 


ser 


pro 


thr 


pro 


thr thr 


ala 


leu 


ala 


arg 


trp 


ala 


pro 


leu 


61/21 


































GCT ATC AGG 


CCA 


GCG 


TCG 


ACT 


ATG 


TGG 


TAA 


ACA CAC 


TGC 


GCA 


ACA 


GCG 


GTT 


TTG 


ATG 


TGC 


ala ile arg 


nrn 


ala 


ser 


thr 


met 


trD 


OCH 


thr his 


cys 


ala 


thr 


ala 


val 


leu 


met 


cys 


121/41 
















151/51 
















AAA CCC CGG 


AGT 


TCT 


CCG 


CTC 


GCG 


TGT 


TCA 


AGG CCG 


AAA 


AAG 




TGG 


TGA 


CCC 


TCG 


GCG 


lys pro arg 


ser 


ser 


pro 


leu 


ala 


cys 


ser 


arg pro 


lvs 


lvs 


alv 


trp OPA pro 


ser 


ala 


181/61 
















211/71 


















GCA ACA CCG 


TGG 


AGG 


CGA 


GGG 


CGC 


TCG 


AGT 


ACA GCC 


TCG 


GCA 


CAC 


CGC 


CGG 


ACG 


GGG 


TGA 


ala thr pro 


trp 


arg arg gly 


arg 


ser 


ser 


thr ala 


ser 


ala 


his 


arg 


arg 


thr gly OPA 


241/81 
















271/91 


















CGG GCC CGC 


TGG 


TGG 


CTG 


CCC 


CCG 


CCG 


ACG 


ACA GTC 


CGG 


GCT 


GCA 


GTC 


CGT 


CGG 


ACT 


ACG 


arg ala arg 


trp 


trp 


leu 


pro 


pro 


pro 


thr 


thr val 


arg 


ala 


ala 


val 


arg 


arg 


thr 


thr 


301/101 
















331/111 














ACA GGC TGC 


CGG 


TGT 


CCG 


GTG 


CGG 


TGG 


TGC 


TGG TAG 


ATC 
















thr gly cys 


arg 


cys 


pro 


val 


arg 


trp 


cys 


trp AMB 


ile 

















SEQ ID N° 19B' 
FIGURE 19B« 



1/1 














31/11 


















ATC GAA ACT 


GCA 


GGA 


CAT 


CGC 


CAA 


CGC CAA 


CGA CGG 


CAC 


TCG 


CGC 


GGT 


GGG 


CAC 


CCC 


TGG 


ile glu thr 
61/21 


ala 


gly 


his 


arg gin 


arg gin 


arg arg 
91/31 


his 


ser 


arg gly gly his 


pro 


trp 


CTA TCA GGC 


CAG 


CGT 


CGA 


CTA 


TGT 


GGT AAA 


CAC ACT 


GCG 


CAA 


CAG 


CGG 


TTT 


TGA 


TGT 


GCA 


leu ser gly 
121/41 


gin 


arg 


arg 


leu 


cys 


gly lys 


his thr 
151/51 


ala 


gin 


gin 


arg 


phe 


OPA 


cys 


ala 


AAC CCC GGA 


GTT 


CTC 


CGC 


TCG 


CGT 


GTT CAA 


GGC CGA 


AAA 


AGG 


GGT 


GGT 


GAC 


CCT 


CGG 


CGG 


asn pro gly val 
181/61 


leu 


arg 


ser 


arg 


val gin 


gly arg 
211/71 


lys 


arg 


gly gly 


asp 


pro 


arg 


arg 


CAA CAC CGT 


GGA 


GGC 


GAG 


GGC 


GCT 


CGA GTA 


CAG CCT 


CGG 


CAC 


ACC 


GCC 


GGA 


CGG 


GGT 


GAC 


gin his arg gly gly 
241/81 


glu 


gly 


ala 


arg val 


gin pro 
271/91 


arg 


his 


thr 


ala 


gly 


arg gly 


asp 


GGG CCC GCT 


GGT 


GGC 


TGC 


CCC 


CGC 


CGA CGA 


CAG TCC 


GGG 


CTG 


CAG 


TCC 


GTC 


GGA 


CTA 


CGA 


gly pro ala 
301/101 


gly 


gly 


cys 


pro 


arg 


arg arg 


gin ser 
331/111 


gly 


leu 


gin 


ser 


val 


gly 


leu 


arg 


CAG GCT GCC 


GGT 


GTC 


CGG 


TGC 


GGT 


GGT GCT 


GGT AGA 


TC 
















gin ala ala 


gly 


val 


arg 


cys 


gly gly ala 


gly arg 



















SEQ ID N° 19C 
FIGURE 19C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



70/185 



sequence Rv0418 predite par Cole et 
seql9A' 

1/1 

atg gtg aac aaa tec agg atg atg ccg gcg 
Met val asn lys ser arg met met pro ala 
61/21 

ctg acg acg ggc tgt ate egg tgg tct acg 
leu thr thr gly cys ile arg trp ser thr 
121/41 

gec gca gag ttc gec gtt gcg ttg cgc aac 
ala ala glu phe ala val ala leu arg asn 
181/61 

eta teg aaa ctg cag gac ate gec aac gec 
leu ser lys leu gin asp ile ala asn ala 
241/81 

ggc tat cag gec age gtc gac tat gtg gta 
gly tyr gin ala ser val asp tyr val val 
301/101 

caa acc ccg gag ttc tec get cgc gtg ttc 
gin thr pro glu phe ser ala arg val phe 
361/121 

ggc aac acc gtg gag gcg agg gcg etc gag 
gly asn thr val glu ala arg ala leu glu 
421/141 

acg ggc ccg ctg gtg get gec ccc gee gac 
thr gly pro leu val ala ala pro ala asp 
481/161 

gac agg ctg ccg gtg tec ggt gcg gtg gtg 
asp arg leu pro val ser gly ala val val 
541/181 

cag aag gaa gac gca gec gcg cag cgc ggt 
gin lys glu asp ala ala ala gin arg gly 
601/201 

gac gag cag gcg atg ggc ggc acc ctg ggg 
asp glu gin ala met gly gly thr leu gly 
661/221 

agt gtc acc aag teg gtc gga ttc cag eta 
ser val thr lys ser val gly phe gin leu 
721/241 

etc acg gcg age acc caa agt ttc aag gee 
leu thr ala ser thr gin ser phe lys ala 
781/261 

teg teg gec aac gtg gtg atg gca ggt gcg 
ser ser ala asn val val met ala gly ala 
841/281 

ate aac gac aac ggc teg gga gtg get gcg 
ile asn asp asn gly ser gly val ala ala 
901/301 

tea ccg cat gtg tec aac gcg gta egg ttc 
ser pro his val ser asn ala val arg phe 
961/321 

att ggg tea cga aac tac gtc gag teg ctg 
ile gly ser arg asn tyr val glu ser leu 



al. (Nature 393:537-544) et contenant 



31/11 

gtg ctg gee gtg get gtg gtc gtc gca ttc 
val leu ala val ala val val val ala phe 
91/31 

cag teg egg ccc gtt gtt aac ggc ccc get 
gin ser arg pro val val asn gly pro ala 
151/51 

egg gtg age acc gac gcg atg atg gcg cac 
arg val ser thr asp ala met met ala his 
211/71 

aac gac ggc act cgc gcg gtg ggc acc cct 
asn asp gly thr arg ala val gly thr pro 
271/91 

aac aca ctg cgc aac age ggt ttt gat gtg 
asn thr leu arg asn ser gly phe asp val 
331/111 

aag gee gaa aaa ggg gtg gtg acc etc ggc 
lys ala glu lys gly val val thr leu gly 
391/131 

tac age etc ggc aca ccg ccg gac ggg gtg 
tyr ser leu gly thr pro pro asp gly val 
451/151 

gac agt ccg ggc tgc agt ccg teg gac tac 
asp ser pro gly cys ser pro ser asp tyr 
511/171 

ctg gta gat cgc ggc gtc tgt cct ttt gee 
leu val asp arg gly val cys pro phe ala 
571/191 

gcg gtg gcg ctg ate att get gac aac ate 
ala val ala leu ile ile ala asp asn ile 
631/211 

get aat acc gac gtc aag ate ccg gtg gtg 
ala asn thr asp val lys ile pro val val 
691/231 

cgc gga cag tct ggg cca acc acc gtc aag 
arg gly gin ser gly pro thr thr val lys 
751/251 

cgc aac gtc ate gcg cag acg aag acg ggg 
arg asn val ile ala gin thr lys thr gly 
811/271 

cat ttg gac age gtt ccg gaa gga ccc ggc 
his leu asp ser val pro glu gly oro gly 
871/291 

gtt ctg gaa acg gca gtg cag ctg ggg aac 
val leu glu thr ala val gin leu gly asn 
931/311 

gec ttc tgg ggc gec gag gaa ttc ggc ctg 
ala phe trp gly ala glu glu phe gly leu 
991/331 

gac ate gac gcg etc aaa ggc ate gcg ctg 
asp ile asp ala leu lys gly ile ala leu 



SEQ ID N° 19 D 
FIGURE 19D 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



71/185 



PCT/FR98/01813 



1021/341 

tat ctg aac ttc gac 
tyr leu asn phe asp 
1081/361 

cag teg ctg ccg eta 
gin ser leu pro leu 
1141/381 

gag cgc acg ttc gtc 
glu arg thr phe val 
1201/401 

gac ggt egg tec gac 
asp gly arg ser asp 
1261/421 

tec ggc get gag gtc 
ser gly ala glu val 
1321/441 

gag cct ttc gat ccc 
glu pro phe asp pro 
1381/461 

gcg etc ggt ate aac 
ala leu gly ile asn 
1441/481 

ggc ggc ccc aac ggg 

gly gly pro asn gly 

1501/501 

tga 

OPA 



atg 
met 


ttg 
leu 


gcg 
ala 


teg 
ser 


ccg 
pro 


gac 
asp 


gcc 
ala 


cgc ggt cag 
arg gly gin 


gcc 
ala 


tat 
tyr 


ctg 
leu 


aag 
lys 


atg 
met 


tac 
tyr 


gac 
asp 


ggc ttc 
gly phe 


acg 
thr 


aag 
lys 


aag 
lys 


tec 
ser 


gcc 
ala 


gag 

glu 


aac 
asn 


tat 
tyr 


cac 
his 


cag 
gin 


aag 
lys 


ggc 
gly 


get 
ala 


ggc 
gly 


gtc 
val 


gcg 
ala 


gtt 
val 


ccg 
pro 


gtc 
val 


atg 
met 


gcg 
ala 



1051/351 

aac ccg ggt tac ttc 
asn pro gly tyr phe 
1111/371 

ccg gtg gtg ccc gaa 
pro val val pro glu 
1171/391 

gcc ggc aag ace gcg 
ala gly lys thr ala 
1231/411 

ctg gcg ggt ate cct 
leu ala gly ile pro 
1291/431 

caa gcc gag etc tgg 
gin ala glu leu trp 
1351/451 

aca gac acc ctg gac 
thr asp thr leu asp 
1411/471 

tac gcg gtg ggt ttg 
tyr ala val gly leu 
1471/491 

gac cgc acc cgc cac 
asp arg thr arg his 



acc tac gac ggt gac 
thr tyr asp gly asp 

ggc teg gcc ggt ate 
gly ser ala gly ile 

cag gac acc teg ttc 
gin asp thr ser phe 

teg ggt ggc ctg ttc 
ser gly gly leu phe 

ggc ggc acc gcc gac 
gly gly thr ala asp 

cat ate gac cgc acc 
his ile asp arg thr 

tat gcg cag gac etc 
tyr ala gin asp leu 

ctg att gcc aaa ccg 
leu ile ala lys pro 



SEQ ID N° 19D (suite) 
FIGURE 19D (suite) 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCI7FR98/01813 



72/185 



ORF d'apres Cole et al. (Nature 393:537-544) et contenant Rv0418 
1/1 31/11 

tag gcc att caa cgc tct gtt cgt ttg att ggt egg tgg gat gcg aaa get gcg egg cga 
AMB ala ile gin arg ser val arg leu ile gly arg tro asp ala lys ala ala arg arg 
61/21 91/31 

cag gcg egg tct aat ctg ggc gcg atg gtg aac aaa tec agg atg atg ccg gcg gtg ctg 
gin ala arg ser asn leu gly ala met val asn lys ser arg met met pro ala val leu 
121/41 151/51 

gcc gtg get gtg gtc gtc gca ttc ctg acg acg ggc tgt ate egg tgg tct acg cag teg 
ala val ala val val val ala phe leu thr thr gly cys ile arg trp ser thr gin ser 
181/61 211/71 

egg ccc gtt gtt aac ggc ccc get gcc gca gag ttc gcc gtt gcg ttg cgc aac egg gtg 
arg pro val val asn gly pro ala ala ala glu phe ala val ala leu arg asn arg val 
241/81 271/91 

age ace gac gcg atg atg gcg cac eta teg aaa ctg cag gac ate gcc aac gcc aac gac 
ser thr asp ala met met ala his leu ser lys leu gin asp ile ala asn ala asn asp 
301/101 331/111 

ggc act cgc gcg gtg ggc ace cct ggc tat cag gcc age gtc gac tat gtg gta aac aca 
gly thr arg ala val gly thr pro gly tyr gin ala ser val asp tyr val val asn thr 
361/121 391/131 

ctg cgc aac age ggt ttt gat gtg caa acc ccg gag ttc tec get cgc gtg ttc aag gcc 
leu arg asn ser gly phe asp val gin thr pro glu phe ser ala arg val phe lys ala 
421/141 451/151 

gaa aaa ggg gtg gtg acc etc ggc ggc aac acc gtg gag gcg agg gcg etc gag tac age 
glu lys gly val val thr leu gly gly asn thr val glu ala arg ala leu glu tyr ser 
481/161 511/171 

etc ggc aca ccg ccg gac ggg gtg acg ggc ccg ctg gtg get gcc ccc gcc gac gac agt 
leu gly thr pro pro asp gly val thr gly pro leu val ala ala pro ala asp asD ser 
541/181 571/191 

ccg ggc tgc agt ccg teg gac tac gac agg ctg ccg gtg tec ggt gcg gtg gtg ctg gta 
pro gly cys ser pro ser asp tyr asp arg leu pro val ser gly ala val val leu val 
601/201 631/211 

gat cgc ggc gtc tgt cct ttt gcc cag aag gaa gac gca gcc gcg cag cgc ggt gcg gtg 
asp arg gly val cys pro phe ala gin lys glu asp ala ala ala gin arg gly ala val 
661/221 691/231 

gcg ctg ate att get gac aac ate gac gag cag gcg atg ggc ggc acc ctg ggg get aat 
ala leu ile ile ala asp asn ile asp glu gin ala met gly gly thr leu gly ala asn 
721/241 751/251 

acc gac gtc aag ate ccg gtg gtg agt gtc acc aag teg gtc gga ttc cag eta cgc gga 
thr asp val lys ile pro val val ser val thr lys ser val gly phe gin leu arg gly 
781/261 811/271 

cag tct ggg cca acc acc gtc aag etc acg gcg age acc caa agt ttc aag gcc cgc aac 
gin ser gly pro thr thr val lys leu thr ala ser thr gin ser phe lys ala arg asn 
841/281 871/291 

gtc ate gcg cag acg aag acg ggg teg teg gcc aac gtg gtg atg gca ggt gcg cat ttg 
val ile ala gin thr lys thr gly ser ser ala asn val val met ala gly ala his leu 
901/301 931/311 

gac age gtt ccg gaa gga ccc ggc ate aac gac aac ggc teg gga gtg get gcg gtt ctg 
asp ser val pro glu gly pro gly ile asn asp asn glv ser gly val ala ala val leu 
961/321 991/331 

gaa acg gca gtg cag ctg ggg aac tea ccg cat gtg tec aac gcg gta egg ttc gcc ttc 
glu thr ala val gin leu gly asn ser pro his val ser asn ala val arg phe ala phe 



SEQ ID N° 19 F 



FIGURE 19F 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



1021/341 

tgg ggc gcc gag gaa ttc ggc 
trp gly ala glu glu phe gly 
1081/361 

gac gcg etc aaa ggc ate gcg 
asp ala leu lys gly ile ala 
1141/381 

ggt tac ttc acc tac gac ggt 
gly tyr phe thr tyr asp gly 
1201/401 

gtg ccc gaa ggc teg gcc ggt 
val pro glu gly ser ala gly 
1261/421 

aag acc gcg cag gac acc teg 
lys thr ala gin asp thr ser 
1321/441 

ggt ate cct teg ggt ggc ctg 
gly ile pro ser gly gly leu 
1381/461 

gag etc tgg ggc ggc acc gcc 
glu leu trp gly gly thr ala 
1441/481 

acc ctg gac cat ate gac cgc 
thr leu asp his ile asp arg 
1501/501 

gtg ggt ttg tat gcg cag gac 
val gly leu tyr ala gin asp 
1561/521 

acc cgc cac ctg att gcc aaa 
thr arg his leu ile ala lys 



73/185 

1051/351 
ctg att ggg tea cga aac 
leu ile gly ser arg asn 

1111/371 
ctg tat ctg aac ttc gac 
leu tyr leu asn phe asp 

1171/391 
gac cag teg ctg ccg eta 
asp gin ser leu pro leu 

1231/411 
ate gag cgc acg ttc gtc 
ile glu arg thr phe val 

1291/431 
ttc gac ggt egg tec gac 
phe asp gly arg ser asp 

1351/451 
ttc tec ggc get gag gtc 
phe ser gly ala glu val 

1411/471 
gac gag cct ttc gat ccc 
asp glu pro phe asp pro 

1471/491 
acc gcg etc ggt ate aac 
thr ala leu gly ile asn 

1531/511 
etc ggc ggc ccc aac ggg 
leu gly gly pro asn gly 

ccg tga 
pro OPA 



tac gtc gag teg ctg gac ate 
tyr val glu ser leu asp ile 

atg ttg gcg teg ccg aac ccg 
met leu ala ser pro asn pro 

gac gcc cgc ggt cag ccg gtg 
asp ala arg gly gin pro val 

gcc tat ctg aag atg gcc ggc 
ala tyr leu lys met ala gly 

tac gac ggc ttc acg ctg gcg 
tyr asp gly phe thr leu ala 

aag aag tec gcc gag caa gcc 
lys lys ser ala glu gin ala 

aac tat cac cag aag aca gac 
asn tyr his gin lys thr asp 

ggc get ggc gtc gcg tac gcg 
gly ala gly val ala tyr ala 

gtt ccg gtc atg gcg gac cgc 
val pro val met ala asp arg 



SEQ ID N° 19F (suite) 



FIGURE 19F (suite) 



CGA GAC AGT GGT GCG GGA CAC TTG AGT TCG 
arg asp ser gly ala gly his leu ser ser 
61/21 

CGC GGT GTG GGA CTC ACG TTC GGT GAG GGT 
arg gly val gly leu thr phe gly glu gly 
121/41 

GGC CGG CTG GCA ACC GTC GGT TTC GAC GTT 
gly arg leu ala thr val gly phe asp val 
181/61 

TGA GCT CCC CGT TTT GCT GGA TGC CCA GGC 
OPA ala pro arg phe ala gly cys pro gly 
241/81 

GCA CAT GGT GCC GGC AGG GAG GAA CAG TGG 
ala his gly ala gly arg glu glu gin trp 
301/101 

TCG GTG CGT GCA TGC TCG CAG CCG GAT GCA 
ser val arg ala cys ser gin pro asp ala 
361/121 

CCG ACA AAT CCG GAC CAC TGC ATC AGG ATC 
pro thr asn pro asp his cys ile arg ile 

SEQ ID 



31/11 

GCT GCT AAC GAC GCC AGA GTC GCC CGC TTC 
ala ala asn asp ala arg val ala arg phe 
91/31 

ACA GCG GAC CTT CGA GCA CGC AAT ATC GTG 
thr ala asp leu arg ala arg asn ile val 
151/51 

GGT GAC GAC CCC TCG TTC ATG AAT CGT TCT 
gly asp asp pro ser phe met asn arg ser 
211/71 

ACC GCC GGT ACT GCT GCG CTT AAG CTT GTC 
thr ala gly thr ala ala leu lys leu val 
271/91 

GCA AGC AGC TAG CCG CGC TCG CCG CGC TGG 
ala ser ser AMB pro arg ser pro arg trp 
331/111 

CCA ACG TGG TCG ACG GGA CCG CCG TGG CTG 
pro thr trp ser thr gly pro pro trp leu 



N° 20A 



FEUILLE DE REMP|^^E^J^(REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



74/185 



GAG ACA GTG GTG CGG GAC ACT 
glu thr val val arg asp thr 
62/21 

GCG GTG TGG GAC TCA CGT TCG 
ala val trp asp ser arg ser 
122/41 

GCC GGC TGG CAA CCG TCG GTT 
ala gly trp gin pro ser val 
182/61 

GAG CTC CCC GTT TTG CTG GAT 
glu leu pro val leu leu asp 
242/81 

CAC ATG GTG CCG GCA GGG AGG 
his met val pro ala gly arg 
302/101 

CGG TGC GTG CAT GCT CGC AGC 
arg cys val his ala arg ser 
362/121 

CGA CAA ATC CGG ACC ACT GCA 
arg gin ile arg thr thr ala 



32/11 

TGA GTT CGG CTG CTA ACG 
OPA val arg leu leu thr 
92/31 

GTG AGG GTA CAG CGG ACC 
val arg val gin arg thr 

152/51 
TCG ACG TTG GTG ACG ACC 
ser thr leu val thr thr 

212/71 
GCC CAG GCA CCG CCG GTA 
ala gin ala pro pro val 

272/91 
AAC AGT GGG CAA GCA GCT 
asn ser gly gin ala ala 

332/111 
CGG ATG CAC CAA CGT GGT 
arg met his gin arg gly 

TCA GGA TC 
ser gly 



SEQ ID N° 20B 
FIGURE 20B 



ACG CCA GAG TCG CCC GCT TCC 
thr pro glu ser pro ala ser 

TTC GAG CAC GCA ATA TCG TGG 
phe glu his ala ile ser trp 

CCT CGT TCA TGA ATC GTT CTT 
pro arg ser OPA ile val leu 

CTG CTG CGC TTA AGC TTG TCG 
leu leu arg leu ser leu ser 

AGC CGC GCT CGC CGC GCT GGT 
ser arg ala arg arg ala gly 

CGA CGG GAC CGC CGT GGC TGC 
arg arg asp arg arg gly cys 



AGA CAG TGG TGC GGG ACA CTT GAG TTC GGC 
arg gin trp cys gly thr leu glu phe gly 
63/21 

CGG TGT GGG ACT CAC GTT CGG TGA GGG TAC 
arg cys gly thr his val arg OPA gly tyr 
123/41 

CCG GCT GGC AAC CGT CGG TTT CGA CGT TGG 
pro ala gly asn arg arg phe arg arg trp 
183/61 

AGC TCC CCG TTT TGC TGG ATG CCC AGG CAC 
ser ser pro phe cys trp met pro arg his 
243/81 

ACA TGG TGC CGG CAG GGA GGA ACA GTG GGC 
thr trp cys arg gin gly gly thr val gly 
303/101 

GGT GCG TGC ATG CTC GCA GCC GGA TGC ACC 
gly ala cys met leu ala ala gly cys thr 
363/121 

GAC AAA TCC GGA CCA CTG CAT CAG GAT C 
asp lys ser gly pro leu his gin asp 



33/11 

TGC TAA CGA CGC CAG AGT CGC CCG CTT CCG 
cys OCH arg arg gin ser arg pro leu pro 
93/31 

AGC GGA CCT TCG AGC ACG CAA TAT CGT GGG 
ser gly pro ser ser thr gin tyr arg gly 
153/51 

TGA CGA CCC CTC GTT CAT GAA TCG TTC TTG 
OPA arg pro leu val his glu ser phe leu 
213/71 

CGC CGG TAC TGC TGC GCT TAA GCT TGT CGC 
arg arg tyr cys cys ala OCH ala cys arg 
273/91 

AAG CAG CTA GCC GCG CTC GCC GCG CTG GTC 
lys gin leu ala ala leu ala ala leu val 
333/111 

AAC GTG GTC GAC GGG ACC GCC GTG GCT GCC 
asn val val asp gly thr ala val ala ala 



SEQ ID N° 20C 
FEUILLE DE REMfiE£6@%B^REGLE 26) 



WO 99/09186 PCT/FR98/01813 

75/185 

partie de la sequence nucleotidique de seq20A 



1/1 31/11 



TGT GGG 


ACT 


CAC 


GTT 


CGG 


TGA 


GGG 


TAC 


AGC 


GGA CCT 


TCG 


AGC 


ACG 


CAA 


TAT 


CGT 


GGG 


CCG 


cys gly thr his 


val 


arg OPA gly 


tyr 


ser 


gly pro 


ser 


ser 


thr 


gin 


tyr 


arg 


gly 


pro 


61/21 


















91/31 


















GCT GGC 


AAC 


CGT 


CGG 


TTT 


CGA 


CGT 


TGG 


TGA 


CGA CCC 


CTC 


GTT 


CAT 


GAA 


TCG 


TTC 


TTG 


AGC 


ala gly 


asn 


arg 


arg phe 


arg 


arg 


trp 


OPA 


arg pro 


leu 


val 


his 


glu 


ser 


phe 


leu 


ser 


121/41 


















151/51 


















TCC CCG 


TTT 


TGC 


TGG 


ATG 


CCC 


AGG 


CAC 


CGC 


CGG TAC 


TGC 


TGC 


GCT 


TAA 


GCT 


TGT 


CGC 


ACA 


ser pro phe 


cys 


trp met 


pro 


arg 


his 


arg 


arg tyr 


cys 


cys 


ala 


OCH 


ala 


cys 


arg 


thr 


181/61 


















211/71 


















TGG TGC 


CGG 


CAG 


GGA 


GGA 


ACA 


GTG 


GGC 


AAG 


CAG CTA 


GCC 


GCG 


CTC 


GCC 


GCG 


CTG 


GTC 


GGT 


trp cys 


arg 


gin 


gly 


gly 


thr 


val 


gly lys 


gin leu 


ala 


ala 


leu 


ala 


ala 


leu 


val 


gly 


241/81 


















271/91 


















GCG TGC 


ATG 


CTC 


GCA 


GCC 


GGA 


TGC 


ACC 


AAC 


GTG GTC 


GAC 


GGG 


ACC 


GCC 


GJG 


GCT 


GCC 


GAC 


ala cys 


met 


leu 


ala 


ala 


gly cys 


thr 


asn 


val val 


asp 


gly 


thr 


ala 


val 


ala 


ala 


asp 



301/101 

AAA TCC GGA CCA CTG CAT CAG GAT C 
lys ser gly pro leu his gin asp 



SEQ ID N° 20A' 
FIGURE 2 OA 1 



1/1 

GTG GGA CTC ACG TTC GGT GAG 
val gly leu thr phe gly glu 
61/21 

CTG GCA ACC -GTC GGT TTC GAC 
leu ala thr val gly phe asp 
121/41 

CCC CGT TTT GCT GGA TGC CCA 
pro arg phe ala gly cys pro 
181/61 

GGT GCC GGC AGG GAG GAA CAG 
gly ala gly arg glu glu gin 
241/81 

CGT GCA TGC TCG CAG CCG GAT 
arg ala cys ser gin pro asp 
301/101 

AAT CCG GAC CAC TGC ATC AGG 
asn pro asp his cys ile arg 







31/11 




GGT ACA 


GCG 


GAC CTT 


CGA 


gly thr 


ala 


asp leu 


arg 






91/31 




GTT GGT 


GAC 


GAC CCC 


TCG 


val gly 


asp 


asp pro 


ser 






151/51 




GGC ACC 


GCC 


GGT ACT 


GCT 


gly thr 


ala 


gly thr 


ala 






211/71 




TGG GCA 


AGC 


AGC TAG 


CCG 


trp ala 


ser 


ser AMB 


pro 






271/91 




GCA CCA 


ACG 


TGG TCG 


ACG 


ala pro 


thr 


trp ser 


thr 


ATC 








ile 









SEQ ID N° 20B' 
FIGURE 20B' 



GCA CGC AAT ATC GTG GGC CGG 
ala arg asn ile val gly arg 

TTC ATG AAT CGT TCT TGA GCT 
phe met asn arg ser CPA ala 

GCG CTT AAG CTT GTC GCA CAT 
ala leu lys leu val ala his 

CGC TCG CCG CGC TGG TCG GTG 
arg ser pro arg trp ser val 

GGA CCG CCG TGG CTG CCG ACA 
gly pro pro trp leu pro thr 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



76/185 



1/1 

GTG TGG GAC TCA CGT TCG GTG AGG GTA CAG 
val trp asp ser arg ser val arg val gin 
61/21 

GGC TGG CAA CCG TCG GTT TCG ACG TTG GTG 
gly trp gin pro ser val ser thr leu val 
121/41 

CTC CCC GTT TTG CTG GAT GCC CAG GCA CCG 
leu pro val leu leu asp ala gin ala pro 
181/61 

ATG GTG CCG GCA GGG AGG AAC AGT GGG CAA 
met val pro ala gly arg asn ser gly gin 
241/81 

TGC GTG CAT GCT CGC AGC CGG ATG CAC CAA 
cys val his ala arg ser arg met his gin 
301/101 

CAA ATC CGG ACC ACT GCA TCA GGA TC 
gin ile arg thr thr ala ser gly 

SEQ 



31/11 

CGG ACC TTC GAG CAC GCA ATA TCG TGG GCC 
arg thr phe glu his ala ile ser trp ala 
91/31 

ACG ACC CCT CGT TCA TGA ATC GTT CTT GAG 
thr thr pro arg ser OPA ile val leu glu 
151/51 

CCG GTA CTG CTG CGC TTA AGC TTG TCG CAC 
pro val leu leu arg leu ser leu ser his 
211/71 

GCA GCT AGC CGC GCT CGC CGC GCT GGT CGG 
ala ala ser arg ala arg arg ala gly arg 
271/91 

CGT GGT CGA CGG GAC CGC CGT GGC TGC CGA 
arg gly arg arg asp arg arg gly cys arg 



ID N° 20C 



FIGURE 20C 



sequence Rv3576 predite par Cole etal. ( 
1/1 

atg ggc aag cag eta gec gcg etc gec gcg 
met gly lys gin leu ala ala leu ala ala 
61/21 

tgc acc aac gtg gtc gac ggg acc gec gtg 
cys thr asn val val asp gly thr ala val 
121/41 

gat ccg ata ccg gtt tea gcg ctt gaa ggg 
asp pro ile pro val ser ala leu glu gly 
181/61 

gcg ctg ggt gcg aca teg atg aag gtg tgg 
ala leu gly ala thr ser met lys val trp 
241/81 

aag age gtg gec gac aag aat tgc ctg get 
lys ser val ala asp lys asn cys leu ala 
301/101 

gee ggc acc ggg tgg acc get atg cgc ggc 
ala gly thr gly trp thr ala met arg gly 
361/121 

aag aaa cgc gac cac tac gee att caa gcg 
lys lys arg asp his tyr ala ile gin ala 
421/141 

gag gag ttc tac age tec teg gtg caa age 
glu glu phe tyr ser ser ser val gin ser 
481/161 

gaa gtc acc ccc gga cag gac gac gee gec 
glu val thr pro gly gin asp asp ala ala 
541/181 

ggc atg etc agt age teg cag gtt cag gaa 
gly met leu ser ser ser gin val gin glu 
601/201 

ctg act gcg cgc aac aac gtc act ate gac 
leu thr ala arg asn asn val thr ile asp 
661/221 

ttg gtg gcg att ggc ate get aac caa ate 
leu val ala ile gly ile ala asn gin ile 



Nature 393:537-544) et contenant seq20A' 
31/11 

ctg gtc ggt gcg tgc atg etc gca gec gga 
leu val gly ala cys met leu ala ala gly 
91/31 

get gee gac aaa tec gga cca ctg cat cag 
ala ala asp lys ser gly pro leu his gin 
151/51 

ctg ctt etc gac ttg age cag ate aat gec 
leu leu leu asp leu ser gin ile asn ala 
211/71 

ttc aac gec aag gca atg tgg gac tgg age 
phe asn ala lys ala met trp asp trp ser 
271/91 

ate gac ggt cca gca cag gaa aag gtc tat 
ile asp gly pro ala gin glu lys val tyr 
331/111 

caa egg ctg gat gac age ate gat gac tec 
gin arg leu asp asp ser ile asp asp ser 
391/131 

gtc gtc ggc ttc ccg acc gca cat gat gee 
val val gly phe pro thr ala his asp ala 
451/151 

tgg age age tgc teg aac cgc egg ttt gtc 
trp ser ser cys ser asn arg arg phe val 
511/171 

tgg act gtg get gac gtt gtc aac gac aac 
trp thr val ala asp val val asn asp asr. 
571/191 

ggc ggc gac gga tgg acc tgc cag cgt gee 
gly gly asp gly trp thr cys gin arg ala 
631/211 

att gtc acq tgc gec tat age caa ccg gat 
ile val thr cys ala tyr ser gin pro asp 
691/231 

gcg gee aag gtt gec aag cag tag 
ala ala lys val ala lys gin AM3 



SEQ ID N° 20D 



FIGURE 20D 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT7FR98/01813 



77/185 



ORF d'apres Cole et al . (Nature 393:537-544) et contenant Rv3576 
1/1 31/11 

taa get tgt cgc aca tgg tgc egg cag gga gga aca gtg ggc aag cag eta gee gcg etc 
OCH ala cys arg thr trp cys arg gin gly gly thr val gly lys gin leu ala ala leu 
61/21 91/31 

gee gcg ctg gtc ggt gcg tgc atg etc gca gec gga tgc ace aac gtg gtc gac ggg acc 
ala ala leu val gly ala cys met leu ala ala gly cys thr asn val val asp gly thr 
121/41 151/51 

gee gtg get gee gac aaa tec gga cca ctg cat cag gat ccg ata ccg gtt tea gcg ctt 
ala val ala ala asp lys ser gly pro leu his gin asp pro ile pro val ser ala leu 
181/61 211/71 

gaa ggg ctg ctt etc gac ttg age cag ate aat gec gcg ctg ggt gcg aca teg atg aag 
glu gly leu leu leu asp leu ser gin ile asn ala ala leu gly ala thr ser met lys 
241/81 271/91 

gtg tgg ttc aac gee aag gca atg tgg gac tgg age aag age gtg gee gac aag aat tgc 
val trp phe asn ala lys ala met trp asp trp ser lys ser val ala asp lys asn cys 
301/101 331/111 

ctg get ate gac ggt cca gca cag gaa aag gtc tat gec ggc acc ggg tgg acc get atg 
leu ala ile asp gly pro ala gin glu lys val tyr ala gly thr gly trp thr ala met 
361/121 391/131 

cgc ggc caa egg ctg gat gac age ate gat gac tec aag aaa cgc gac cac tac gec att 
arg gly gin arg leu asp asp ser ile asp asp ser lys lys arg asp his tyr ala ile 
421/141 451/151 

caa gcg gtc gtc ggc ttc ccg acc gca cat gat gec gag gag ttc tac age tec teg gtg 
gin ala val val gly phe pro thr ala his asp ala glu glu phe tyr ser ser ser val 
481/161 511/171 

caa age tgg age age tgc teg aac cgc egg ttt gtc gaa gtc acc ccc gga cag gac gac 
gin ser tro ser ser cys ser asn arg arg phe val glu val thr pro gly gin asp asp 
541/181 * 571/191 

gee gee tgg act gtg get gac gtt gtc aac gac aac ggc atg etc agt age teg cag gtt 
ala ala trp thr val ala asp val val asn asp asn gly met leu ser ser ser gin val 
601/201 631/211 

cag gaa ggc ggc gac gga tgg acc tgc cag cgt gec ctg act gcg cgc aac aac gtc act 
gin glu gly gly asp gly trp thr cys gin arg ala leu thr ala arg asn asn val thr 
661/221 691/231 

ate gac att gtc acg tgc gee tat age caa ccg gat ttg gtg gcg att ggc ate get aac 
ile asp ile val thr cys ala tyr ser gin pro asp leu val ala ile gly ile ala asn 
721/241 

caa ate gcg gee aag gtt get aag cag tag 
gin ile ala ala lys val ala lys gin AMB 



SEQ ID N° 20F 
FIGURE 20F 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCTYFR98/01813 



78/185 



1/1 

GTC CTG GTC GCC GCG CAA CTG 
val leu val ala ala gin leu 
61/21 

CGC TGG TAG TGG CGA TGG TGT 
arg trp AMB trp arg trp cys 
121/41 

GCG GCC TGC GGC TGG TCG CCG 
ala ala cys gly trp ser pro 
181/61 

CGG CGC TGG ACG TCG CCG TGC 
arg arg trp thr ser pro cys 
241/81 

AAA ACT TCA CCG CCC GCA AGT 
lys thr ser pro pro ala ser 
301/101 

CAG ACG TGC GGT CGG GAG TGA 
gin thr cys gly arg glu OPA 
361/121 

TGC TGG CCG ACA GCA TCG GCT 
cys trp pro thr ala ser ala 









31/11 




GCC 


GGT 




GAI GGA 


AAC* 


ala gly 


pro 


asp gly 


lys 








ft 1 /01 

91/31 




TAG 


CAG 


GAT 


I GC GGG 


TCG 


AMB gin 


asp 


cys gly 


ser 








1 C 1 /CI 

151/51 




CGC 


GCG 


CCG 


k n n try n. 

AAA TGA 


TAC 


arg 


ala 


pro 


lys OPA 


tyr 








211/71 




TGG 


CCA 


GCT 


CGA CCG 


GAC 


trp 


pro 


aia 


arg pro 


asp 








271/91 




ACG 


AGC 


TGC 


AGA CGC 


GAC 


thr 


ser 


cys 


arg arg 


asp 








331/111 




ACA 


CGC 


TGC 


TCA ACG 


GCG 


thr 


arg 


cys 


ser thr 


ala 


TGC 


GGG 


ATC 






cys 


gly 


ile 







TGT TCA CGA TCG CGC TTC TGC 
cys ser arg ser arg phe cys 

AGG CTG CGA TGG CCA GCA CCA 
arg leu arg trp pro ala pro 

CCG CGA TCA CGA AAT ACA TGT 
pro arg ser arg asn thr cys 

ACG ATG TGG AGG GGG CGC AGA 
thr met trp arg gly arg arg 

TGG CCG ACA CCG ACG TCA TCG 
trp pro thr pro thr ser ser 

GTC AGG CGC TGC TGG ATA AGA 
val arg arg cys trp ile arg 



SEQ ID N° 21A 



FIGURE 21A 



TCC TGG TCG CCG CGC AAC TGG CCG GTC CCG 
ser trp ser pro arg asn trp pro val pro 
62/21 

GCT GGT AGT GGC GAT GGT GTT AGC AGG ATT 
ala gly ser gly asp gly val ser arg ile 
122/41 

CGG CCT GCG GCT GGT CGC CGC GCG CGC CGA 
arg pro ala ala gly arg arg ala arg arg 
182/61 

GGC GCT GGA CGT CGC CGT GCT GGC CAG CTC 
gly ala gly arg arg arg ala gly gin leu 
242/81 

AAA CTT CAC CGC CCG CAA GTA CGA GCT GCA 
lys leu his arg pro gin val arg ala ala 
302/101 

AGA CGT GCG GTC GGG AGT GAA CAC GCT GCT 
arg arg ala val gly ser glu his ala ala 
362/121 

GCT GGC CGA CAG CAT CGG CTT GCG GGA TC 
ala gly arg gin his arg leu ala gly 

SEQ IE 



32/11 

ATG GAA AGT GTT CAC GAT CGC GCT TCT GCC 
met glu ser val his asp arg ala ser ala 
92/31 

GCG GGT CGA GGC TGC GAT GGC CAG CAC CAG 
ala gly arg gly cys asp gly gin his gin 
152/51 

AAT GAT ACC CGC GAT CAC GAA ATA CAT GTC 
asn asp thr arg asp his glu ile his val 
212/71 

GAC CGG ACA CGA TGT GGA GGG GGC GCA GAA 
asp arg thr arg cys gly gly gly ala glu 
272/91 

GAC GCG ACT GGC CGA CAC CGA CGT CAT CGC 
asp ala thr gly arg his arg arg his arg 
332/111 

CAA CGG CGG TCA GGC GCT GCT GGA TAA GAT 
gin arg arg ser gly ala ala gly OCH asp 



N° 21B 



FIGURE 2 IB 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



79/185 



















^/ 1 1 


















CCT GGT 


CGC 


CGC 


GCA ACT 


GGC 


Cbb 




TCC QfiA 
1 \J\3 /\M/\ 


GTG 


TTC 


AfG 


ATC 


GCG 


CTT 


CTG 


ccg 


pro gly arg arg 


aia 


thr gly 


arg 


ser arg 


trp lys 


val phe 


tnr 


ile 


ala 


leu 


leu 


pro 


63/21 
















/ ^ 1 


















CTG GTA 


GTG 


GCG 




GTG 


TTA 


CPA 


ririh TTG 


HGG gtc 


par 




GCG 


ATG 


GCC 


AGC 


ACC 


AGC 


leu val 


val 


ala 


met 


val 


leu 


did 


gly leu 


arg val 


glu 


aia 


CI X ct 


met 


ala 


ser 


thr 


ser 


123/41 
















153/51 


















GGC CTG 


CGG 


CTG 


ulL 


GCC 


GCG 


CGC 


rirc gaa 


ATG ATA 






ATC 


ACG 


AAA 


TAC 


ATG 


TCG 


gly leu 


arg 


leu 


Vdl 


ala 


ala 


arg 


ala glu 


lUc L. lie 


pro 


aia 




thr lys 


tyr 




cor" 


183/ ol 
















213/71 


















GCG CTG 


GAC 


GTC 


GCC 


GTG 


CTG 


GCC 


AGC TCG 


Arc GGA 


CAC 


GAT 


GTG 


GAG 


GGG 


GCG 


CAG 


AAA 


ala leu 


asp 


val 


ala 


val 


leu 


ala 


ser ser 


t- K r rr 1 t/ 

l ii i. y i. y 


his 


asp 


val 


glu 


gly 


ala 


gin 




243/81 
















273/91 


















AAC TTC 


ACC 


GCC 


CGC 


AAG 


TAC 


GAG 


CTG CAG 


ACG CGA 


CTG 


GCC 


GAC 


ACC 


GAC 


GTC 


ATC 


GCA 


asn phe 


thr 


ala 


arg 


lys 


tyr glu 


leu gin 


thr arg 


leu 


ala 


asp 


thr 


asp 


val 


ile 


ala 


303/101 
















333/111 


















GAC GTG 


CGG 


TCG 


GGA 


GTG 


AAC 


ACG 


CTG CTC 


AAC GGC 


GGT 


CAG 


GCG 


CTG 


CTG 


GAT 


AAG 


ATG 


asp val 


arg 


ser 


gly 


val 


asn 


thr 


leu leu 


asn gly 


gly 


gin 


ala 


leu 


leu 


asp 


lys 


met 


363/121 


































CTG GCC 


GAC 


AGC 


ATC 


GGC 


TTG 


CGG 


GAT C 




















leu ala 


asp 


ser 


ile 


gly 


leu 


arg 


asp 





















SEQ ID N° 21C 
FIGURE 21C 



partie de la sequence nucleotidique de seq21A 



1/1 31/11 



ACG ATC 


GCG 


CTT 


CTG 


CCG 


CTG 


GTA 


GTG 


GCG 


ATG GTG 


TTA 


GCA 


GGA 


TTG 


CGG 


GTC GAG 


GCT 


thr ile 


ala 


leu 


leu 


pro 


leu 


val 


val 


ala 


met val 


leu 


ala 


gly 


leu 


arg 


val glu 


ala 


61/21 


















91/31 
















GCG ATG 


GCC 


AGC 


ACC 


AGC 


GGC 


CTG 


CGG 


CTG 


GTC GCC 


GCG 


CGC 


GCC 


GAA 


ATG 


ATA CCC 


GCG 


ala met 


ala 


ser 


thr 


ser 


gly 


leu 


arg 


leu 


val ala 


ala 


arg 


ala 


glu 


met 


ile pro 


ala 


121/41 


















151/51 
















ATC ACG 


AAA 


TAC 


ATG 


TCG 


GCG 


CTG 


GAC 


GTC 


GCC GTG 


CTG 


GCC 


AGC 


TCG 


ACC 


GGA CAC 


GAT 


ile thr 


lys 


tyr 


met 


ser 


ala 


leu 


asp 


val 


ala val 


leu 


ala 


ser 


ser 


thr gly his 


asp 


181/61 
















211/71 
















GTG GAG 


GGG 


GCG 


CAG 


AAA 


AAC 


TTC 


ACC 


GCC 


CGC AAG 


TAC 


GAG 


CTG 


CAG 


ACG 


CGA CTG 


GCC 


val glu gly 


ala 


gin 


lys 


asn 


phe 


thr 


ala 


arg lys 


tyr 


glu 


leu 


gin 


thr 


arg leu 


ala 


241/81 


















271/91 
















GAC ACC 


GAC 


GTC 


ATC 


GCA 


GAC 


GTG 


CGG 


TCG 


GGA GTG 


AAC 


ACG 


CTG 


CTC 


AAC 


GGC GGT 


CAG 


asp thr 


asp 


val 


ile 


ala 


asp 


val 


arg 


ser 


gly val 


asn 


thr 


leu 


leu 


asn 


gly gly 


gin 


301/101 


















331/111 
















GCG CTG 


CTG 


GAT 


AAG 


ATG 


CTG 


GCC 


GAC 


AGC 


ATC GGC 


TTG 


CGG 


GAT 


C 








ala leu 


leu 


asp 


lys 


met 


leu 


ala 


asp 


ser 


ile g 1 y 


leu 


arg 


asp 











SEQ ID N° 21A' 
FIGURE 21A' 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



80/185 



1/1 

CGA TCG CGC TTC TGC CGC TGG 
arg ser arg phe cys arg trp 
61/21 

CGA TGG CCA GCA CCA GCG GCC 
arg trp pro ala pro ala ala 
121/41 

TCA CGA AAT ACA TGT CGG CGC 
ser arg asn thr cys arg arg 
181/61 

TGG AGG GGG CGC AGA AAA ACT 
trp arg gly arg arg lys thr 
241/81 

ACA CCG ACG TCA TCG CAG ACG 
thr pro thr ser ser gin thr 
301/101 

CGC TGC TGG ATA AGA TGC TGG 
arg cys trp ile arg cys trp 









^1/11 

Jl/ IX 










I ob lul 


inu 


AMD 


crp 


arg 


crp cys 


AMD 
















Ibb 


AUb L-bb 


C*bC 


cys 


gly 


t> r-r\ 

crp 


ser pro 


arg 








151/51 




1 bb 


Apr 1 




CCG TGC 


TGG 


trp 


thr 


ser 


pro cys 


trp 








211/71 




TCA 


CCG 


CCC 


GCA AGT 


ACG 


ser 


pro 


pro 


ala ser 


thr 








271/91 




TGC 


GGT 


CGG 


GAG TGA 


ACA 


cys 


gly 


arg 


glu OPA thr 








331/111 




CCG 


ACA 


GCA 


TCG GCT 


TGC 


pro 


thr 


ala 


ser ala 


cys 




SEQ 


ID 


N° 21B 


! 



FIGURE 21B' 



CAG GAT TGC GGG TCG AGG CTG 
gin asp cys gly ser arg leu 

GCG CCG AAA TGA TAC CCG CGA 
ala pro lys OPA tyr pro arg 

CCA GCT CGA CCG GAC ACG ATG 
pro ala arg pro asp thr met 

AGC TGC AGA CGC GAC TGG CCG 
ser cys arg arg asp trp pro 

CGC TGC TCA ACG GCG GTC AGG 
arg cys ser thr ala val arg 

GGG ATC 
gly ile 



1/1 

CAC GAT CGC GCT TCT GCC GCT 
his asp arg ala ser ala ala 
61/21 

TGC GAT GGC CAG CAC CAG CGG 
cys asp gly gin his gin arg 
121/41 

GAT CAC GAA ATA CAT GTC GGC 
asp his glu ile his val gly 
181/61 

TGT GGA GGG GGC GCA GAA AAA 
cys gly gly gly ala glu lys 
241/81 

CGA CAC CGA CGT CAT CGC AGA 
arg his arg arg his arg arg 
301/101 

GGC GCT GCT GGA TAA GAT GCT 
gly ala ala gly OCH asp ala 



31/11 

GGT AGT GGC GAT GGT GTT 
gly ser gly asp gly val 
91/31 

CCT GCG GCT GGT CGC CGC 
pro ala ala gly arg arg 
151/51 

GCT GGA CGT CGC CGT GCT 
ala gly arg arg arg ala 

211/71 
CTT CAC CGC CCG CAA GTA 
leu his arg pro gin val 

271/91 
CGT GCG GTC GGG AGT GAA 
arg ala val gly ser glu 

331/111 
GGC CGA CAG CAT CGG CTT 
gly arg gin his arg leu 



SEQ ID N° 21C 
FIGURE 21C 



AGC AGG ATT GCG GGT CGA GGC 
ser arg ile ala gly arg gly 

GCG CGC CGA AAT GAT ACC CGC 
ala arg arg asn asp thr arg 

GGC CAG CTC GAC CGG ACA CGA 
gly gin leu asp arg thr arg 

CGA GCT GCA GAC GCG ACT GGC 
arg ala ala asp ala thr gly 

CAC GCT GCT CAA CGG CGG TCA 
his ala ala gin arg arg ser 

GCG GGA TC 
ala gly 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



81/185 



sequence Rv3365c predite par Cole et 
Seq2lA' 

1/1 

gtg acc atg ttc gcc cgc ccg acc ate ccg 
val thr met phe ala arg pro thr ile pro 
61/21 

ccg get caa ccg gcc cgc ggc aaa cct cag 
pro ala gin pro ala arg gly lys pro gin 
121/41 

tgg ccg gtc cga tgg aaa gtg ttc acg ate 
trp pro val arg trp lys val phe thr ile 
181/61 

tta gca gga ttg egg gtc gag get gcg atg 
leu ala gly leu arg val glu ala ala met 
241/81 

gcg cgc gcc gaa atg ata ccc gcg ate acg 
ala arg ala glu met ile pro ala ile thr 
301/101 

ctg gcc age teg acc gga cac gat gtg gag 
leu ala ser ser thr gly his asp val glu 
361/121 

tac gag ctg cag acg cga ctg gcc gac acc 
tyr glu leu gin thr arg leu ala asp thr 
421/141 

aac acg ctg etc aac ggc ggt cag gcg ctg 
asn thr leu leu asn gly gly gin ala leu 
481/161 

ttg egg gat egg gtc acc gcc tac gcg ccg 
leu arg asp arg val thr ala tyr ala pro 
541/181 

gcg teg gtg egg gtt gac age gag caa ate 
ala ser val arg val asp ser glu gin ile 
601/201 

gtt ggc gcc cgc ggg cag atg acg atg cag 
val gly ala arg gly gin met thr met gin 
661/221 

gcc gag ccg caa ctg cgc age gcg atg gtt 
ala glu pro gin leu arg ser ala met val 
721/241 

ttc ggg atg age gcg gcg etc ggt gca ggc 
phe gly met ser ala ala leu gly ala gly 
781/261 

atg gtg acc agg atg gcg ate atg tec gat 
met val thr arg met ala ile met ser asp 
841/281 

ctg ctg cac teg ata cag ate acc cgc gac 
leu leu his ser ile gin ile thr arg asp 
901/301 

gag gcg gtg acg aag teg gtg caa age cag 
glu ala val thr lys ser val gin ser gin 
961/321 

gac gcc gtg ctg gtg ttg gcc gcc ate gcg 
asp ala val leu val leu ala ala ile ala 



al. (Nature 393:537-544) et contenant 



31/11 

gtc gcg gcg gcc get tct gat att tec gcc 
val ala ala ala ala ser asp ile ser ala 
91/31 

caa cgc ccg ccg tec tgg teg ccg cgc aac 
gin arg pro pro ser trp ser pro arg asn 
151/51 

gcg ctt ctg ccg ctg gta gtg gcg atg gtg 
ala leu leu pro leu val val ala met val 
211/71 

gcc age acc age ggc ctg egg ctg gtc gcc 
ala ser thr ser gly leu arg leu val ala 
271/91 

aaa tac atg teg gcg ctg gac gtc gcc gtg 
lys tyr met ser ala leu asp val ala val 
331/111 

ggg gcg cag aaa aac ttc acc gcc cgc aag 
gly ala gin lys asn phe thr ala arg lys 
391/131 

gac gtc ate gca gac gtg egg teg gga gtg 
asp val ile ala asp val arg ser gly val 
451/151 

ctg gat aag gtg ctg gcc gac age ate ggc 
leu asp lys val leu ala asp ser ile gly 
511/171 

ctg ctg ttg acg gcc cag aac gtg att gac 
leu leu leu thr ala gin asn val ile asp 
571/191 

cga acc cag gtg cag ggt ttg age cga gcc 
arg thr gin val gin gly leu ser arg ala 
631/211 

gag ate ctg gtg act cgc ggc gcc gac ctt 
glu ile leu val thr arg gly ala asp leu 
691/231 

acc ctg gcc ggc acc gaa ccc teg acg ctg 
thr leu ala gly thr glu pro ser thr leu 
751/251 

teg ccg gac acc aag aac ctg cag cag caa 
ser pro asp thr lys asn leu gin gin gin 
811/271 

ccg gcc gtt gca ctg gtc aac aac cca gag 
pro ala val ala leu val asn asn pro glu 
871/291 

att gcc gag cag gtg ate acc gac acc acc 
ile ala glu gin val ile thr asp thr thr 
931/311 

gcc acc gac egg egg gat gcc gcg att cgc 
ala thr asp arg arg asp ala ala ile arg 
991/331 

acc gcg ate gtc gtc gtg ttg gtg gtg gcg 
thr ala ile val val val leu val val ala 



SEQ ID N° 21F 



FIGURE 21D 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



82/185 



1021/341 

cgc acg ctg gtc ggg ccg atg egg gta ctg 
arg thr leu val gly pro met arg val leu 
1081/361 

gat etc gac ggc gag ate gcg gcg gtc cgc 
asp leu asp gly glu ile ala ala val arg 
1141/381 

gcg gtg tac acc acc gag gaa ate ggt cag 
ala val tyr thr thr glu glu ile gly gin 
1201/401 

egg gec ctg ttg ctg gee ggc gag gaa acg 
arg ala leu leu leu ala gly glu glu thr 
1261/421 

gag acc atg teg egg cgt age cgt tec ctg 
glu thr met ser arg arg ser arg ser leu 
1321/441 

ctg gag cgc aac gag gag gat ccc gee cga 
leu glu arg asn glu glu asp pro ala arg 
1381/461 

gee gec egg ctg cgc cgc aac age gee aac 
ala ala arg leu arg arg asn ser ala asn 
1441/481 

cgt gac cac cgc gag ccg gtg ccg ctg tea 
arg asp his arg glu pro val pro leu ser 
1501/501 

gag gac tat cgc cgc gtc gac ate gcg agg 
glu asp tyr arg arg val asp ile ala arg 
1561/521 

get ggt ggc gtc att cat ctg ctt gec gag 
ala gly gly val ile his leu leu ala glu 
1621/541 

ccg acc acaccc gtt egg gtt gec gec gca 
pro thr thr pro val arg val ala ala ala 
1681/561 

ate teg gat tec ggc ctg ggc atg acc gat 
ile ser asp ser gly leu gly met thr asp 
1741/581 

egg gec ggc ggt gag gtc acc ccg gat agt 
arg ala gly gly glu val thr pro asp ser 
1801/601 

egg ctg gec ggt egg cac ggc ate cga gtc 
arg leu ala gly arg his gly ile arg val 
1861/621 

ggc acc ggc acc acc gee gag gtc tac ctg 
gly thr gly thr thr ala glu val tyr leu 
1921/641 

gcg cag ccg cca aag ccg egg gta ttt gcg 
ala gin pro pro lys pro arg val phe ala 
1981/661 

gee gat ccg acg gac gtt ccc gee gec ate 
ala asp pro thr asp val pro ala ala ile 



1051/351 



cgt gat ggg gcg 
arg asp gly ala 
1111/371 


etc 
leu 


aag 
lys 


gtt 
val 


get 
ala 


cat 
his 


acc 
thr 


gec ggc gac gag 
ala gly asp glu 
1171/391 


ccg 
pro 


ate 
ile 


ccc 
pro 


gag 
glu 


cca 
pro 


ctg 
leu 


gtc gcg cat 
val ala his 
1231/411 


gcg 
ala 


gtc 
val 


gac gag 
asp glu 


ctg 
leu 


cac 
his 


acc 
thr 


egg ttg cga 
arg leu arg 
1291/431 


ctg 
leu 


ctg 
leu 


gtc 
val 


aac 
asn 


gag 
glu 


atg 
met 


ttt 
phe 


gtc gac cag 
val asp gin 
1351/451 


cag 
gin 


ctg 
leu 


teg 
ser 


gtc 
val 


ate 
ile 


gac 
asp 


caa 
gin 


etc gac age 
leu asp ser 
1411/471 


ctt 
leu 


ttc 
phe 


egg 
arg 


etc 
leu 


gat 
asp 


cac 
his 


ctg 
leu 


ctg ctg gtg 
leu leu val 
1471/491 


ctg 
leu 


gee 
ala 


ggt gcg 
gly ala 


cag 
gin 


att 
ile 


acc 
thr 


acc gtg ate 
thr val ile 
1531/511 


age 
ser 


gec 
ala 


gec 
ala 


gtg 
val 


tea 
ser 


gag 
glu 


gtc 
val 


gta ccc gac 
val pro asp 
1591/531 


tgt 
cys 


gcg 
ala 


gta 
val 


gtc 
val 


ggc 
gly 


gca 
ala 


gcg 
ala 


ctg ate gac 
leu ile asp 
1651/551 


aac 
asn 


gcg 
ala 


ttg 
leu 


cgc 
arg 


tac 
tyr 


teg 
ser 


tea 
ser 


ate ggc age 
ile gly ser 
1711/571 


gaa 
glu 


ggc 
gly 


agt 
ser 


gtt 
val 


ctg 
leu 


ctg 
leu 


cga 
arg 


gec gat egg 
ala asp arg 
1771/591 


egg 
arg 


atg 
met 


gee 
ala 


aat 
asn 


atg 
met 


c gg 

arg 


ctg 
leu 


gec egg cac 
ala arg his 
1831/611 


atg 
met 


ggt 
gly 


ctg ttc 
leu phe 


gta 
val 


gtc 
val 


ggc 
gly 


ggg ctg cgc ggt ccg 
gly leu arg gly pro 
1891/631 


gtg 
val 


acc 
thr 


ggt 

gly 


gaa 
glu 


cag 
gin 


ccg eta gec 
pro leu ala 
1951/651 


gtg 
val 


etc 
leu 


gag 
glu 


ggg 

gly 


acg 
thr 


gec 
ala 


cca 
pro 


ate aag ccg 
ile lys pro 
2011/671 


ccg 
pro 


tgt 
cys 


cct 
pro 


gaa 
glu 


ccc 
pro 


gcg 
ala 


gcg 
ala 


ggg ccg eta 
gly pro leu 


cca 
pro 


ccg 
pro 


gtc 
val 


acg 
thr 


ttg 
leu 


etc 
leu 


ccg 
pro 



SEQ ID N° 21D (suite 1) 
FIGURE 21D (suite 1) 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



83/185 



2041/681 

cgc cgt acc ccg ggg 
arg arg thr pro gly 
2101/701 

egg cgc gag ctg aaa 
arg arg glu leu lys 
2161/721 

ccc gca cca gaa ccg 
pro ala pro glu pro 
2221/741 

gtt gat gac gac gtc 
val asp asp asp val 
2281/761 

ctg gec cac age ccc 
leu ala his ser pro 
2341/781 

gee gag gee gcg gac 
ala glu ala ala asp 
2401/801 

ccc ggg gec egg tta 
pro gly ala arg leu 
2461/821 

ggt gca gcg eta gca 
gly ala ala leu ala 
2521/841 

gcg gta cgc gac ccc 
ala val arg asp pro 
2581/861 

acc ggg egg teg cat 
thr gly arg ser his 



tec agt ggc ate gec 
ser ser gly ile ala 

aca ccc tgg tgg gag 
thr pro trp trp glu 

cga ccg gcg ccg ccg 
arg pro ala pro pro 

ate tac egg egg atg 
ile tyr arg arg met 

gat ctg gac tgg aag 
asp leu asp trp lys 

aag ccc gtg cag tec 
lys pro val gin ser 

gtg ccg ggg gcg gcg 
val pro gly ala ala 

tec aac ggc gga ctt 
ser asn gly gly leu 

gac gcg gtt cgt gec 
asp ala val arg ala 

gec cgc gag age agt 
ala arg glu ser ser 



2071/691 

gac gtc ccg gec cag 
asp val pro ala gin 
2131/711 

gat agg ttt caa cag 
asp arg phe gin gin 
2191/731 

ccc gee aaa ccc gcg 
pro ala lys pro ala 
2251/751 

etc tec gag atg gtg 
leu ser glu met val 
2311/771 

teg gtg tgg gac cac 
ser val trp asp his 
2371/791 

cgc acg gac tac ggc 
arg thr asp tyr gly 
2431/811 

gtg cct gag gga ccc 
val pro glu gly pro 
2491/831 

cat ccc ggc cga gcg 
his pro gly arg ala 
2551/851 

tec ate age age cat 
ser ile ser ser his 
2611/871 

cag gga ccc aat cag 
gin gly pro asn gin 



ccg atg cag cag egg 
pro met gin gin arg 

gag ccc aaa caa ccg 
glu pro lys gin pro 

cca ccg gcg ggc ccg 
pro pro ala gly pro 

ggt gac ccg cac gag 
gly asp pro his glu 

ggc tgg teg gcg gee 
gly trp ser ala ala 

ctg ccg gtg cgc gaa 
leu pro val arg glu 

gat egg gag cat ccg 
asp arg glu his pro 

ccg egg cac gcg get 
pro arg his ala ala 

ttc ggc ggc gtg cgc 
phe gly gly val arg 

caa tga 
gin OPA 



SEQ ID N° 21D (suite) 
FIGURE 21D (suite) 
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ORF d'apres par Cole et al. 
1/1 

taa ggg tgc ggc egg tgg cac 
OCH gly cys gly arg trp his 
61/21 

ccg gtc gcg gcg gec get tct 
pro val ala ala ala ala ser 
121/41 

cag caa cgc ccg ccg tec tgg 
gin gin arg pro pro ser trp 
181/61 

ate gcg ctt ctg ccg ctg gta 
ile ala leu leu pro leu val 
241/81 

atg gec age acc age ggc ctg 
met ala ser thr ser gly leu 
301/101 

acg aaa tac atg teg gcg ctg 
thr lys tyr met ser ala leu 
361/121 

gag ggg gcg cag aaa aac ttc 
glu gly ala gin lys asn phe 
421/141 

acc gac gtc ate gca gac gtg 
thr asp val ile ala asp val 
481/161 

ctg ctg gat aag gtg ctg gec 
leu leu asp lys val leu ala 
541/181 

ccg ctg ctg ttg acg gee cag 
pro leu leu leu thr ala gin 
601/201 

ate cga acc cag gtg cag ggt 
ile arg thr gin val gin gly 
661/221 

cag gag ate ctg gtg act cgc 
gin glu ile leu val thr arg 
721/241 

gtt acc ctg gee ggc acc gaa 
val thr leu ala gly thr glu 
781/261 

ggc teg ccg gac acc aag aac 
gly ser pro asp thr lys asn 
841/281 

gat ccg gee gtt gca ctg gtc 
asp pro ala val ala leu val 



(Nature 393:537-544) et 
31/11 

ggc cgc ggc cac gtg acc 
gly arg gly his val thr 
91/31 

gat att tec gee ccg get 
asp ile ser ala pro ala 

151/51 
teg ccg cgc aac tgg ccg 
ser pro arg asn trp pro 

211/71 
gtg gcg atg gtg tta gca 
val ala met val leu ala 

271/91 
egg ctg gtc gee gcg cgc 
arg leu val ala ala arg 

331/111 
gac gtc gee gtg ctg gec 
asp val ala val leu ala 

391/131 
acc gec cgc aag tac gag 
thr ala arg lys tyr glu 

451/151 
egg teg gga gtg aac acg 
arg ser gly val asn thr 

511/171 
gac age ate ggc ttg egg 
asp ser ile gly leu arg 

571/191 
aac gtg att gac gcg teg 
asn val ile asp ala ser 

631/211 
ttg age cga gec gtt ggc 
leu ser arg ala val gly 

691/231 
ggc gee gac ctt gee gag 
gly ala asp leu ala glu 

751/251 
ccc teg acg ctg ttc ggg 
pro ser thr leu phe gly 

811/271 
ctg cag cag caa atg gtg 
leu gin gin gin met val 

871/291 
aac aac cca gag ctg ctg 
asn asn pro glu leu leu 



SEQ ID N° 21F 
FIGURE 21F 



contennant Rv3365c 



atg ttc gee cgc ccg acc ate 
met phe ala arg pro thr ile 

caa ccg gee cgc ggc aaa cct 
gin pro ala arg gly lys pro 

gtc cga tgg aaa gtg ttc acg 
val arg trp lys val phe thr 

gga ttg egg gtc gag get gcg 
gly leu arg val glu ala ala 

gec gaa atg ata ccc gcg ate 
ala glu met ile pro ala ile 

age teg acc gga cac gat gtg 
ser ser thr gly his asp val 

ctg cag acg cga ctg gec gac 
leu gin thr arg leu ala asp 

ctg etc aac ggc ggt cag gcg 
leu leu asn gly gly gin ala 

gat egg gtc acc gee tac gcg 
asp arg val thr ala tyr ala 

gtg egg gtt gac age gag caa 
val arg val asp ser glu gin 

gee cgc ggg cag atg acg atg 
ala arg gly gin met thr met 

ccg caa ctg cgc age gcg atg 
pro gin leu arg ser ala met 

atg age gcg gcg etc ggt gca 
met ser ala ala leu gly ala 

acc agg atg gcg ate atg tec 
thr arg met ala ile met ser 

cac teg ata cag ate acc cgc 
his ser ile gin ile thr arg 
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901/301 

gac att gcc gag cag gtg ate acc gac acc 
asp ile ala glu gin val ile thr asp thr 
961/321 

cag gcc acc gac egg egg gat gcc gcg att 
gin ala thr asp arg arg asp ala ala ile 
1021/341 

gcg acc gcg ate gtc gtc gtg ttg gtg gtg 
ala thr ala ile val val val leu val val 
1081/361 

ctg cgt gat ggg gcg etc aag gtt get cat 
leu arg asp gly ala leu lys val ala his 
1141/381 

cgc gcc ggc gac gag ccg ate ccc gag cca 
arg ala gly asp glu pro ile pro glu pro 
1201/401 

cag gtc gcg cat gcg gtc gac gag ctg cac 
gin val ala his ala val asp glu leu his 
1261/421 

acg egg ttg cga ctg ctg gtc aac gag atg 
thr arg leu arg leu leu val asn glu met 
1321/441 

ctg gtc gac cag cag ctg teg gtc ate gac 
leu val asp gin gin leu ser val ile asp 
1381/461 

cga etc gac age ctt ttc egg etc gat cac 
arg leu asp ser leu phe arg leu asp his 
1441/481 

aac ctg ctg gtg ctg gcc ggt gcg cag att 
asn leu leu val leu ala gly ala gin ile 
1501/501 

tea acc gtg ate age gcc gcc gtg tea gag 
ser thr val ile ser ala ala val ser glu 
1561/521 

agg gta ccc gac tgt gcg gta gtc ggc gca 
arg val pro asp cys ala val val gly ala 
1621/541 

gag ctg ate gac aac gcg ttg cgc tac teg 
glu leu ile asp asn ala leu arg tyr ser 
1681/561 

gca ate ggc age gaa ggc agt gtt ctg ctg 
ala ile gly ser glu gly ser val leu leu 
1741/581 

gat gcc gat egg egg atg gcc aat atg egg 
asp ala asp arg arg met ala asn met arg 
1301/601 

agt gcc egg cac atg ggt ctg ttc gta gtc 
ser ala arg his met gly leu phe val val 



SEQ ID N° 2 
FIGURE 21F 



931/311 

acc gag gcg gtg acg aag teg gtg caa age 
thr glu ala val thr lys ser val gin ser 
991/331 

cgc gac gcc gtg ctg gtg ttg gcc gcc ate 
arg asp ala val leu val leu ala ala ile 
1051/351 

gcg cgc acg ctg gtc ggg ccg atg egg gta 
ala arg thr leu val gly pro met arg val 
1111/371 

acc gat etc gac ggc gag ate gcg gcg gtc 
thr asp leu asp gly glu ile ala ala val 
1171/391 

ctg gcg gtg tac acc acc gag gaa ate ggt 
leu ala val tyr thr thr glu glu ile gly 
1231/411 

acc egg gcc ctg ttg ctg gcc ggc gag gaa 
thr arg ala leu leu leu ala gly glu glu 
1291/431 

ttt gag acc atg teg egg cgt age cgt tec 
phe glu thr met ser arg arg ser arg ser 
1351/451 

caa ctg gag cgc aac gag gag gat ccc gcc 
gin leu glu arg asn glu glu asp pro ala 
1411/471 

ctg gcc gcc egg ctg cgc cgc aac age gcc 
leu ala ala arg leu arg arg asn ser ala 
1471/491 

acc cgt gac cac cgc gag ccg gtg ccg ctg 
thr arg asp his arg glu pro val pro leu 
1531/511 

gtc gag gac tat cgc cgc gtc gac ate gcg 
val glu asp tyr arg arg val asp ile ala 
1591/531 

gcg get ggt ggc gtc att cat ctg ctt gcc 
ala ala gly gly val ile his leu leu ala 
1651/551 

tea ccg acc aca ccc gtt egg gtt gcc gcc 
ser pro thr thr pro val arg val ala ala 
1711/571 

cga ate teg gat tec ggc ctg ggc atg acc 
arg ile ser asp ser gly leu gly met thr 
1771/591 

ctg egg gcc ggc ggt gag gtc acc ccg gat 
leu arg ala gly gly glu val thr pro asp 
1831/611 

ggc egg ctg gcc ggt egg cac ggc ate cga 
gly arg leu ala gly arg his gly ile arg 



F (suite 1) 
(suite 1) 
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1861/621 

gtc ggg ctg cgc ggt ccg gtg acc ggt gaa 
val gly leu arg gly pro val thr gly glu 
1921/641 

ctg ccg eta gec gtg etc gag ggg acg gec 
leu pro leu ala val leu glu gly thr ala 
1981/661 

gcg ate aag ccg ccg tgt cct gaa ccc gcg 
ala ile lys pro pro cys pro glu pro ala 
2041/681 

ate ggg ccg eta cca ccg gtc acg ttg etc 
ile gly pro leu pro pro val thr leu leu 
2101/701 

gec gac gtc ccg gee cag ccg atg cag cag 
ala asp val pro ala gin pro met gin gin 
2161/721 

gag gat agg ttt caa cag gag ccc aaa caa 
glu asp arg phe gin gin glu pro lys gin 
2221/741 

ccg ccc gee aaa ccc gcg cca ccg gcg ggc 
pro pro ala lys pro ala pro pro ala gly 
2281/761 

atg etc tec gag atg gtg ggt gac ccg cac 
met leu ser glu met val gly asp pro his 
2341/781 

aag teg gtg tgg gac cac ggc tgg teg gcg 
lys ser val trp asp his gly trp ser ala 
2401/801 

tec cgc acg gac tac ggc ctg ccg gtg cgc 
ser arg thr asp tyr gly leu pro val arg 
2461/821 

gcg gtg cct gag gga ccc gat egg gag cat 
ala val pro glu gly pro asp arg glu his 
2521/841 

ctt cat ccc ggc cga gcg ccg egg cac gcg 
leu his pro gly arg ala pro arg his ala 
2581/861* 

gee tec ate age age cat ttc ggc ggc gtg 
ala ser ile ser ser his phe gly gly val 
2641/881 

agt cag gga ccc aat cag caa tga 
ser gin gly pro asn gin gin OPA 



1891/631 

cag ggc acc ggc acc acc gee gag gtc tac 
gin gly thr gly thr thr ala glu val tyr 
1951/651 

cca gcg cag ccg cca aag ccg egg gta ttt 
pro ala gin pro pro lys pro arg val phe 
2011/671 

gcg gec gat ccg acg gac gtt ccc gee gee 
ala ala asp pro thr asp val pro ala ala 
2071/691 

ccg cgc cgt acc ccg ggg tec agt ggc ate 
pro arg arg thr pro gly ser ser gly ile 
2131/711 

egg egg cgc gag ctg aaa aca ccc tgg tgg 
arg arg arg glu leu lys thr pro trp trp 
2191/731 

ccg ccc gca cca gaa ccg cga ccg gcg ccg 
pro pro ala pro glu pro arg pro ala pro 
2251/751 

ccg gtt gat gac gac gtc ate tac egg egg 
pro val asp asp asp val ile tyr arg arg 
2311/771 

gag ctg gec cac age ccc gat ctg gac tgg 
glu leu ala his ser pro asp leu asp trp 
2371/791 

gec gee gag gec gcg gac aag ccc gtg cag 
ala ala glu ala ala asp lys pro val gin 
2431/811 

gaa ccc ggg gee egg tta gtg ccg ggg gcg 
glu pro gly ala arg leu val pro gly ala 
2491/831 

ccg ggt gca gcg eta gca tec aac ggc gga 
pro gly ala ala leu ala ser asn gly gly 
2551/851 

get gcg gta cgc gac ccc gac gcg gtt cgt 
ala ala val arg asp pro asp ala val arg 
2611/871 

cgc acc ggg egg teg cat gee cgc gag age 
arg thr gly arg ser his ala arg glu ser 



SEQ ID N° 21F (suite 2) 
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CTA CGA CAA GGC AAA GGA GCA 
leu arg gin gly lys gly ala 
61/21 

CGC CAT TCT GGT CGC AGG TCT 
arg his ser gly arg arg ser 
121/41 

TGA GAC CAC GAC CGC GGC AGG 
OPA asp his asp arg gly arg 
181/61 

CGT CAT CGA CGG TAA GGA CCA 
arg his arg arg OCH gly pro 
241/81 

CAA TGT CAA CAT CGC GAT CGG 
gin cys gin his arg asp arg 
301/101 

CAA CCC TCC GGA GGT GAA GTC 
gin pro ser gly gly glu val 
361/121 

CAC GTC GGG CAC CGG ACA GGG 
his val gly his arg thr gly 









Ol / l 1 
o±/ 1 I 




CAG 


GGT 


GAA 


GCG TGG 


ACT 


gin 


gly 


glu 


ala trp 


thr 








y 1/ j i 




TTC 


CGG 


ATG 


TTC AAG 


CAA 


phe 


arg 


met 


phe lys 


gin 








1 CI /CI 

101/ 0 1 




CAC 


GAC 


GGC 


AAG CCC 


CGG 


his 


asp 


gly 


lys pro 


arg 








^11/ / 1 




GAA 


CGT 


CAC 


CGG GTC 


TGT 


glu arg 


nis 


arg val 


cys 








c 1 1/ y i 




CGG 


GGC 


GGC 


GAC CGG 


CAT 


arg gly 


gly 


asp arg 


his 








331/111 




CGT 


TGG 


GCT 


CGG TAA 


CGT 


arg 


trp 


ala 


arg OCH 


arg 








391/131 




TAA 


CGC 


TCG 


GCA ACC 


AAG 


OCH 


arg 


ser 


ala thr 


lys 



SEQ ID N° 22A 
FIGURE 22A 



GAC GGT CGC GGT AGC CGG AGC 
asp gly arg gly ser arg ser 

CAA GTC GAC TAC AGG AAG CGG 
gin val asp tyr arg lys arg 

CGC CGC ATC CGG GCC GAA GGT 
arg arg ile arg ala glu gly 

GGT GTG CAC AAC CGC GGC CGG 
gly val his asn arg gly arg 

TGC CGC CGT GCT CAC CGA CGG 
cys arg arg ala his arg arg 

CAA CGG CGT CAC GCT GGG ATA 
gin arg arg his ala gly ile 

GAC GGC AGC CAC TAC AAG ATC 
asp gly ser his tyr lys ile 



TAC GAC AAG GCA AAG GAG CAC 
tyr asp lys ala lys glu his 
62/21 

GCC ATT CTG GTC GCA GGT CTT 
ala ile leu val ala gly leu 
122/41 

GAG ACC ACG ACC GCG GCA GGC 
glu thr thr thr ala ala gly 
182/61 

GTC ATC GAC GGT AAG GAC CAG 
val ile asp gly lys asp gin 
242/81 

AAT GTC AAC ATC GCG ATC GGC 
asn val asn ile ala ile gly 
302/101 

AAC CCT CCG GAG GTG AAG TCC 
asn pro pro glu val lys ser 
362/121 

ACG TCG GGC ACC GGA CAG GGT 
thr ser gly thr gly gin gly 









32/11 




AGG 


GTG 


AAG 


CGT GGA 


CTG 


arg 


val 


lys 


arg gly 


leu 








92/31 




TCC 


GGA 


TGT 


TCA AGC 


AAC 


ser 


gly 


cys 


ser ser 


asn 








152/51 




ACG 


ACG 


GCA 


AGC CCC 


GGC 


thr 


thr 


ala 


ser pro 


gly 








212/71 




AAC 


GTC 


ACC 


GGG TCT 


GTG 


asn 


val 


thr 


gly ser 


val 








272/91 




GGG 


GCG 


GCG 


ACC GGC 


ATT 


gly 


ala 


ala 


thr gly 


ile 








332/111 




GTT 


GGG 


CTC 


GGT AAC 


GTC 


val 


gly leu 


gly asn 


val 








392/131 




AAC 


GCT 


CGG 


CAA CCA 


AGG 


asn 


ala 


arg 


gin pro 


arg 



SEQ ID N° 22B 
FIGURE 22B 



ACG GTC GCG GTA GCC GGA GCC 
thr val ala val ala gly ala 

AAG TCG ACT ACA GGA AGC GGT 
lys ser thr thr gly ser gly 

GCC GCA TCC GGG CCG AAG GTC 
ala ala ser gly pro lys val 

GTG TGC ACA ACC GCG GCC GGC 
val cys thr thr ala ala gly 

GCC GCC GTG CTC ACC GAC GGC 
ala ala val leu thr asp gly 

AAC GGC GTC ACG CTG GGA TAC 
asn gly val thr leu gly tyr 

ACG GCA GCC ACT ACA AGA TC 
thr ala ala thr thr arg 
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ACG ACA AGG CAA AGG AGC ACA GGG TGA AGC 
thr thr arg gin arg ser thr gly OPA ser 
63/21 

CCA TTC TGG TCG CAG GTC TTT CCG GAT GTT 
pro phe trp ser gin val phe pro asp val 
123/41 

AGA CCA CGA CCG CGG CAG GCA CGA CGG CAA 
arg pro arg pro arg gin ala arg arg gin 
183/61 

TCA TCG ACG GTA AGG ACC AGA ACG TCA CCG 
ser ser thr val arg thr arg thr ser pro 
243/81 

ATG TCA ACA TCG CGA TCG GCG GGG CGG CGA 
met ser thr ser arg ser ala gly arg arg 
303/101 

ACC CTC CGG AGG TGA AGT CCG TTG GGC TCG 
thr leu arg arg OPA ser pro leu gly ser 
363/121 

CGT CGG GCA CCG GAC AGG GTA ACG CTC GGC 
arg arg ala pro asp arg val thr leu gly 

SEQ IE 



33/11 

GTG GAC TGA CGG TCG CGG TAG CCG GAG CCG 
val asp OPA arg ser arg AMB pro glu pro 
93/31 

CAA GCA ACA AGT CGA CTA CAG GAA GCG GTG 
gin ala thr ser arg leu gin glu ala val 
153/51 

GCC CCG GCG CCG CAT CCG GGC CGA AGG TCG 
ala pro ala pro his pro gly arg arg ser 
213/71 

GGT CTG TGG TGT GCA CAA CCG CGG CCG GCA 
gly leu trp cys ala gin pro arg pro ala 
273/91 

CCG GCA TTG CCG CCG TGC TCA CCG ACG GCA 
pro ala leu pro pro cys ser pro thr ala 
333/111 

GTA ACG TCA ACG GCG TCA CGC TGG GAT ACA 
val thr ser thr ala ser arg trp asp thr 
393/131 

AAC CAA GGA CGG CAG CCA CTA CAA GAT C 
asn gin gly arg gin pro leu gin asp 

> N° 22C 



FIGURE 22C 



GCA CAA CCG CGG CCG GCA ATG TCA ACA TCG 
ala gin pro arg pro ala met ser thr ser 
61/21 

CCG TGC TCA CCG ACG GCA ACC CTC CGG AGG 
pro cys ser pro thr ala thr leu arg arg 
121/41 

GCG TCA CGC TGG GAT ACA CGT CGG GCA CCG 
ala ser arg trp asp thr arg arg ala pro 
181/61 

GCA GCC ACT ACA AGA TCA CAG GGT GAA GCG 
ala ala thr thr arg ser gin gly glu ala 
241/81 

CAT TCT GGT CGC AGG TCT TTC CGG ATG TTC 
his ser gly arg arg ser phe arg met phe 
301/101 

GAC CAC GAC CGC GGC AGG CAC GAC GGC AAG 
asp his asp arg gly arg his asp gly lys 
361/121 

ATC GAC GGT AAG GAC CAG AAC GTC ACC GGC 
ile asp gly lys asp gin asn val thr gly 
421/141 

GTC AAC ATC GCG ATC GGC GGG GCG GCG ACC 
val asn ile ala ile gly gly ala ala thr 
481/161 

CCT CCG GAG GTG AAG TCC GTT GGG CTC GGT 
pro pro glu val lys ser val gly leu gly 
541/181 

TCG GGC ACC GGA CAG GGT AAC GCC TCG GCA 
ser gly thr gly gin gly asn ala ser ala 

SEQ ID 



31/11 

CGA TCG GCG GGG CGG CGA CCG GCA TTG CCG 
arg ser ala gly arg arg pro ala leu pro 
91/31 

TGA AGT CCG TTG GGC TCG GTA ACG TCA ACG 
OPA ser pro leu gly ser val thr ser thr 
151/51 

GAC AGG GTA ACG CCT CGG CAA CCA AGG ACG 
asp arg val thr pro arg gin pro arg thr 
211/71 

TGG ACT GAC GGT CGC GGT AGC CGG AGC CGC 
trp thr asp gly arg gly ser arg ser arg 
271/91 

AAG CAA CAA GTC GAC TAC AGG AAG CGG TGA 
lys gin gin val asp tyr arg lys arg OPA 
331/111 

CCC CGG CGC CGC TCC GGG CCG AAG GTC GTC 
pro arg arg arg ser gly pro lys val val 
391/131 

TCC GTG GTG TGC ACA ACC GCG GCC GGC AAT 
ser val val cys thr thr ala ala gly asn 
451/151 

GGC ATT GCC GCC GTG CTC ACC GAC GGC AAC 
gly ile ala ala val leu thr asp gly asn 
511/171 

AAC GTC AAC GGC GTC ACG CTG GGA TAC ACG 
asn val asn gly val thr leu gly tyr thr 
571/191 

ACC AAG GAC GGC AGC CAC TAC AAG ATC 
thr lys asp gly ser his tyr lys ile 

N° 23A 
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32/11 



CAG AAL, 




GGC 


c* r* 
CGG 


CAA 


TGT 


CAA 


CAT 


CGC 


GAT CGG 


CGG 


GGC 


GGC 


GAC 


CGG 


CAT 


TGC 


CGC 


his asn 


arg 


gly 


arg 


gin 


cys 


gin 


his 


arg 


asp arg arg gly gly 


asp 


arg 


his 


cys 


arg 




















92/31 


















CGI GG1 


rip 
UAL. 


GGA 


CGG 


CAA 


CCC 


TCC 


f*r* t\ 
GGA 


GGT 


GAA GTC 


CGT 


TGG 


GCT 


CGG 


TAA 


CGT 


CAA 


CGG 


arg ala 


nis 


arg 


arg 


gin pro 


ser 


gly 


gly 


glu val 


arg 


trp 


ala 


arg 


OCH 


arg 


gin 


arg 


122/41 


















152/51 
















CGT CAC 


GCT 


GGG 


ATA 


CAC 


GTC 


GGG 


CAC 


CGG 


ACA GGG 


TAA 


CGC 


CTC 


GGC 


AAC 


CAA 


GGA 


CGG 


arg his 


ala 


gly 


lie 


his 


val 


gly 


his 


arg 


thr gly OCH 


arg 


leu 


gly 


asn 


gin 


gly 


arg 


182/ 61 


















212/71 


















CAG GGA 


G i A 


r* TV TV 

GAA 


r* t\ t 
GA1 


CAC 


AGG 


GTG 


AAG 


CGi 


GGA CTG 


ACG 


GTC 


GCG 


GTA 


GCC 


GGA 


GCC 


GCC 


gin pro 


leu 


gin 


asp 


his 


arg 


val 


lys 


arg 


gly leu 


tnr 


val 


ala 


val 


ala 


gly 


ala 


ala 


242/ 8 1 


















272/91 


















ATT CTG 


GTC 


GCA 


GGT 


CTT 


TCC 


GGA 


TGT 


TCA 


AGC AAC 


AAG 


TCG 


ACT 


ACA 


GGA 


AGC 


GGT 


GAG 


ile leu 


val 


ala 


gly 


leu 


ser 


gly 


cys 


ser 


ser asn 


lys 


ser 


thr 


thr gly 


ser 


gly 


glu 


302/101 


















332/111 
















ACC ACG 


ACC 


GCG 


GCA 


GGC 


ACG 


ACG 


GCA 


AGC 


CCC GGC 


GCC 


GCT 


CCG 


GGC 


CGA 


AGG 


TCG 


TCA 


thr thr 


thr 


ala 


ala 


gly 


thr 


thr 


ala 


ser 


pro gly 


ala 


aia 


pro 


gly 


arg 


arg 


ser 


ser 


362/121 


















392/131 


















1 AL-u 






ALL 


AGA ACG 


1 W\ 


UL.(j 


LjL. I 


CCG TGG 


TGT 


GCA 


CAA 


CCG 


CGG 


CCG 


GCA 


ATG 


ser thr 


val 


arg 


thr 


arg 


thr 


ser 


pro 


ala 


pro trp 


cys 


ala 


gin 


pro 


arg 


pro 


ala 


met 


422/141 


















452/151 


















TCA ACA 


TCG 


CGA 


TCG 


GCG 


GGG 


CGG 


CGA 


CCG 


GCA TTG 


CCG 


CCG 


TGC 


TCA 


CCG 


ACG 


GCA 


ACC 


ser thr 


ser 


arg 


ser 


ala gly 


arg 


arg 


pro 


ala leu 


pro 


pro 


cys 


ser 


pro 


thr 


ala 


thr 


482/161 


















512/171 


















CTC CGG 


AGG 


TGA 


AGT 


CCG 


TTG 


GGC 


TCG 


GTA 


ACG TCA 


ACG 


GCG 


TCA 


CGC 


TGG 


GAT 


ACA 


CGT 


leu arg 


arg 


0PA 


ser 


pro 


leu 


gly 


ser 


val 


thr ser 


thr 


ala 


ser 


arg 


trp 


asp 


thr 


arg 


542/181 


















572/191 


















CGG GCA 


CCG 


GAC 


AGG 


GTA 


ACG 


CCT 


CGG 


CAA 


CCA AGG 


ACG 


GCA 


GCC 


ACT 


ACA 


AGA 


TC 




arg ala 


pro 


asp 


arg 


val 


thr 


pro 


arg 


gin 


pro arg 


thr 


ala 


ala 


thr 


thr 


arg 







SEQ ID N° 23B 
FIGURE 23B 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



90/185 



33/11 



ACA ACC 


GCG 


GCC GGC 


AAT 


GTC 


AAC 


ATC 


GCG 


ATC GGC 


GGG 


GCG 


GCG 


ACC 


GGC 


ATT 


CCC 


ccc 


thr thr 


ala 


ala crlv 


asn 


val 


asn 


ile 


ala 


ile gly gly ala 


ala 


thr gly 


IXC 


a 1 a 
did 


ala 
did 


63/21 
















93/31 


















GTG CTC 


ACC 


GAC GGC 


AAC 


CCT 


CCG 


GAG 


GTG 


AAG TCC 


GTT 


GGG 


CTC 


GGT 


AAC 


CTC 


MAC 


ncc 


val leu 


thr 


asp gly 


asn 


pro pro glu val 


lys ser 


val gly 


leu gly 


asn 


val 


asn 


ft 1 \t 

gxy 


123/41 
















153/51 
















GTC ACG 


CTG 


GGA TAC 


ACG 


TCG 


GGC 


ACC 


GGA 


CAG GGT 


AAC 


ccc 


TCG 


GCA 


ACC 


&&c 


chc 


ccc 


val thr 


leu 


alv tvr 


thr 


ser 


gly thr 


gxy 


gin gly 


asn 


a 1 a 

axa 


ser 


ala 


thr 


lys 


asp 


gly 


183/61 
















213/71 












AGC CAC 


TAC 


AAG ATC 


ACA 


GGG 


TGA AGC 


GTG 


GAC TGA 


CGG 


TCC 


CGG 


TAG 


CCG 




ccc 




ser his 


tvr 


lys ile 


thr gly OPA 


ser 


val 


asp OPA 


arg 


ser 


arg 


AMB 


pro 


glu 


pro 


pro 


243/81 
















273/91 














TTC TGG 


TCG 


CAG GTC 


TTT 


CCG 


GAT 


GTT 


CAA 


GCA ACA 


AGT 


CGA 


CTA 


CAG 


GAA 




GTG 


AGA 


phe trp 


ser 


gin va 1 


phe pro 


asp 


val 


gin 


ala thr 


ser 


arg 


leu gin glu 


ala 


val 


arg 


303/101 
















333/111 
















CCA CGA 


CCG 


CGG CAG 


GCA 


CGA 


CGG 


CAA 


GCC 


CCG GCG 


CCG 


CTC 


CGG 


GCC 


GAA 




CGT 


CAT 


n rn p rrr 


pro 


a rn nl n 

a i. u u ii 


ala 


arg 


arg 


gin 


ala 


pro ala 


pro 


leu 


arg 


ala 


glu 


gly 


arg 


his 


363/121 
















393/131 












CGA CGG 


TAA 


GGA CCA 


GAA 


CGT 


CAC 


CGG 


CTC 


CGT GGT 


GTG 


CAC 


AAC 


CGC 


GGC 


CGG 


CAA 


TGT 


arg arg 


OCH 


gly pro 


glu 


arg 


his 


arg 


leu 


arg gly val 


his 


asn 


arg gly 


arg 


gin 


cys 


423/141 
















453/151 












CAA CAT 


CGC 


GAT CGG 


CGG 


GGC 


GGC 


GAC 


CGG 


CAT TGC 


CGC 


CGT 


GCT 


CAC 


CGA 


CGG 


CAA 


CCC 


gin his 


arg 


asp arg 


arg gly gly asp 


arg 


his cys 


arg 


arg 


ala 


his 


arg 


arg 


gin pro 


483/161 
















513/171 


















TCC GGA 


GGT 


GAA GTC 


CGT 


TGG 


GCT 


CGG 


TAA 


CGT CAA 


CGG 


CGT 


CAC 


GCT 


GGG 


ATA 


CAC 


GTC 


ser gly 


gly 


glu val 


arg 


trp 


ala 


arg 


OCH 


arg gin 


arg 


arg 


his 


ala 


gly 


ile 


his 


val 


543/181 
















573/191 


















GGG CAC 


CGG 


ACA GGG 


TAA 


CGC 


CTC 


GGC 


AAC 


CAA GGA 


CGG 


CAG 


CCA 


CTA 


CAA 


GAT 


C 




gly his 


arg 


thr gly 


OCH 


arg 


leu 


gly 


asn 


gin gly arg gin 


pro 


leu 


gin 


asp 







SEQ ID N° 23C 
FIGURE 23C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



91/185 



CTA ACG ACA GGC AAA GGA GCA 
leu thr thr gly lys gly ala 
61/21 

CGC CAT TCT GGT CGC AGG TCT 
arg his ser gly arg arg ser 
121/41 

TGA GAC CAC GAC CGC GGC AGG 
OPA asp his asp arg gly arg 
181/61 

GTC ATC GAC GGT AAG GAC CAG 
val ile asp gly lys asp gin 
241/81 

AAT GTC AAC ATC GCG ATC GGC 
asn val asn ile ala ile gly 
301/101 

AAC CCT CCG GAG GTG AAG TCC 
asn pro pro glu val lys ser 
361/121 

ACG TCG GGC ACC GGA CAG GGT 
thr ser gly thr gly gin gly 



31/11 



CAG 


GGT 


GAA GCG TGG 


ACT 


gin gly 


glu ala trp 


thr 






91/31 




I rc 


r~ r* 

CGG 


ATG TTC AAG 


CAA 


pne 


arg 


met phe lys 


gin 






1 C 1 /CI 

101/ Dl 




CAC 


GAC 


GGC AAG CCC 


CGG 


nis 


asp 


gly lys pro 


arg 






Oil / ^ 1 




AAC 


GTC 




GTG 


asn 


val 


t"Vii" nl u cor 
L>iii. y ± y ser 


Vd J. 






271/91 




GGG 


GCG 


GCG ACC GGC 


ATT 


gly 


ala 


ala thr gly 


ile 






331/111 




GTT 


GGG 


CTC GGT AAC 


GTC 


val 


gly 


leu gly asn 


val 






391/131 




AAC 


GCC 


TCG GCA ACC 


AAG 


asn 


ala 


ser ala thr 


lys 



SEQ ID N° 24A 
FIGURE 24A 



GAC GGT CGC GGT AGC CGG AGC 
asp gly arg gly ser arg ser 

CAA GTC GAC TAC AGG AAG CGG 
gin val asp tyr arg lys arg 

CGC CGC TCC GGG CCG AAG GTC 
arg arg ser gly pro lys val 

GTG TGC ACA ACC GCG GCC GGC 
val cys thr thr ala ala gly 

GCC GCC GTG CTC ACC GAC GGC 
ala ala val leu thr asp gly 

AAC GGC GTC ACG CTG GGA TAC 
asn gly val thr leu gly tyr 

GAC GGC AGC CAC TAC AAG ATC 
asp gly ser his tyr lys ile 



TAA CGA CAG GCA AAG GAG CAC 
OCH arg gin ala lys glu his 
62/21 

GCC ATT CTG GTC GCA GGT CTT 
ala ile leu val ala gly leu 
122/41 

GAG ACC ACG ACC GCG GCA GGC 
glu thr thr thr ala ala gly 
182/61 

TCA TCG ACG GTA AGG ACC AGA 
ser ser thr val arg thr arg 
242/81 

ATG TCA ACA TCG CGA TCG GCG 
met ser thr ser arg ser ala 
302/101 

ACC CTC CGG AGG TGA AGT CCG 
thr leu arg arg OPA ser pro 
362/121 

CGT CGG GCA CCG GAC AGG GTA 
arg arg ala pro asp arg val 









32/11 




AGG 


GTG 


AAG 


CGT GGA 


CTG 


arg 


val 


lys 


arg gly 


leu 








92/31 




TCC 


GGA 


TGT 


TCA AGC 


AAC 


ser 


gly 


cys 


ser ser 


asn 








152/51 




ACG 


ACG 


GCA 


AGC CCC 


GGC 


thr 


thr 


ala 


ser pro 


gly 








212/71 




ACG 


TCA 


CCG 


GCT CCG 


TGG 


thr 


ser 


pro 


ala pro 


trp 








272/91 




GGG 


CGG 


CGA 


CCG GCA 


TTG 


gly 


arg 


arg 


pro ala 


leu 








332/111 




TTG 


GGC 


TCG 


GTA ACG 


TCA 


leu 


gly 


ser 


val thr 


ser 








392/131 




ACG 


CCT 


CGG 


CAA CCA 


AGG 


thr 


pro 


arg 


gin pro 


a rg 



ACG GTC GCG GTA GCC GGA GCC 
thr val ala val ala gly ala 

AAG TCG ACT ACA GGA AGC GGT 
lys ser thr thr qly ser gly 

GCC GCT CCG GGC CGA AGG TCG 
ala ala pro gly arg arg ser 

TGT GCA CAA CCG CGG CCG GCA 
cys ala gin pro arg pro ala 

CCG CCG TGC TCA CCG ACG GCA 
pro pro cys ser pro thr ala 

ACG GCG TCA CGC TGG GAT ACA 
thr ala ser arg trp asp thr 

ACG GCA GCC ACT ACA AGA TC 
thr ala ala thr thr arg 



SEQ ID N° 24B 



FIGURE 24B 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



92/185 



33/11 



AAO GAL 


AGG 


L.AA 


AGG 


AGC 


ALA 


GGG 


1 GA 


AGC GIG GAC 


IGA 


CGG 


TCG 


CGG 


TAG 


CCG 


GAG 


CCG 


asn asp 


arg 


gin 


arg 


ser 


tnr 


gly 


OP A 


ser val asp 


OPA 


arg 


ser 


arg 


AMB 


pro 


glu 


pro 


bo/ 
















3 J/ 31 


















CCA 1 1 L 


1 GG 


1GG 


CAG 


GTC 


TTT 


err 

CCG 


GAI 


rmm /""TATA rPn 

Gil LAA GCA 


ACA 


TV PIP 

AGT 


CGA 


CTA 


CAG 


GAA 


GCG 


GTG 


pro phe 


trp 


ser 


gin 


val 


pne 


pro 


asp 


val gin ala 


thr 


ser 


arg 


leu 


gin 


glu 


ala 


val 


1 O O //II 

123/ 41 
















1 CO /CI 

153/51 


















AGA CCA 


CGA 


r+ 

CCG 


CGG 


CAG 


GCA 


CGA 


CGG 


CAA GCC CCG 


GCG 


CCG 


CTC 


CGG 


GCC 


GAA 


GGT 


CGT 


arg pro 


arg 


pro 


arg 


gin 


ala 


arg 


arg 


gin ala pro 


ala 


pro 


leu 


arg 


ala 


glu 


gly 


arg 


183/ 61 
















213/71 


















PAT p^;a 


pgp, 


TAA 


GGA 


CCA 


GAA 




pap 


prrr; r»TP PHT 


PPT 


PTP 


CAC 


AAC 


ppr* 


GGG 


pop 

GGG 


LAA 


his arg 


arg 


OCH 


gly pro 


glu 


arg 


his 


arg leu arg 


gly 


val 


his 


asn 


arg 


gly 


arg 


gin 


243/81 
















273/91 


















TGT CAA 


CAT 


CGC 


GAT 


CGG 


CGG 


GGC 


GGC 


GAC CGG CAT 


TGC 


CGC 


CGT 


GCT 


CAC 


CGA 


CGG 


CAA 


cys gin 


his 


arg 


asp 


arg 


arg 


gly 


qly 


asp arg his 


cys 


arg 


arg 


ala 


his 


arg 


arg 


gin 


303/101 
















333/111 


















CCC TCC 


GGA 


GGT 


GAA 


GTC 


CGT 


TGG 


GCT 


CGG TAA CGT 


CAA 


CGG 


CGT 


CAC 


GCT 


GGG 


ATA 


CAC 


pro ser 


gly 


gly 


glu 


val 


arg 


trp 


ala 


arg OCH arg 


gin 


arg 


arg 


his 


ala 


gly 


ile 


his 


363/121 
















393/131 


















GTC GGG 


CAC 


CGG 


ACA 


GGG 


TAA 


CGC 


CTC 


GGC AAC CAA 


GGA 


CGG 


CAG 


CCA 


CTA 


CAA 


GAT 


C 


val gly 


his 


arg 


thr 


gly OCH 


arg 


leu 


gly asn gin 


gly 


arg 


gin pro 


leu 


gin 


asp 





SEQ ID N° 24C 
FIGURE 24C 



Amorce directe 
5' ACG CGG CGC AGC CTG TTG 3" 



SEQ ID N° 25 
FIGURE 25 



Amorce inverse 
5' CGA CCT TGG GAT TCG CCT 3' 



SEQ ID N° 26 
FIGURE 26 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



93/185 



CCT ACC AGC AAG AGC CCA GGG 
pro thr ser lys ser pro gly 
61/21 

TCC AAT TTT CCT TCC GCC CCG 
ser asn phe pro ser ala pro 
121/41 

CGG TCG CGC AGC TTG CGG AAA 
arg ser arg ser leu arg lys 
181/61 

GTC GTC GCT CTC CAC CCG TCG 
val val ala leu his pro ser 
241/81 

TCG GCT GAG TGT CTG CAG GGC 
ser ala glu cys leu gin gly 
301/101 

AAG TCC CCC CCG CGC GAC TTC 
lys ser pro pro arg asp phe 
361/121 

CTC ATT TCG CAG CAA GCG GTC 
leu ile ser gin gin ala val 
421/141 

GTC GGA CGA GTC GTC GTC AAC 
val gly arg val val val asn 









■31/ IX 




CTT 


CAC 


AGG 


Apr* Taa 


nno 


leu 


his 


arg 


tnr u^n 


lys 








y 1/ o i 




TGC 


AAT 


app 


ATP TGP 


nnu 


cys 


asn 


tnr 


ile cys 


lys 








iJl/ 0 1 




CGG 


GGT 


ATG 


GAC PPT 


gpp 


arg gly 


met 


asp pro 


aia 








cxxl 1 x 




GGG 


GGC 


GAA 


agp PAT 


TPP 


gly gly 


glu 


ser his 


ser 








£. * xt y j. 




TCC 


GGG 


GAG 


CAG CCG 


ATC 


ser 


gly 


glu 


gin pro 


ile 








0-31/ 111 




CAG 


ACA 


TTT 
i i j. 




PTT 


gin 


thr 


phe 


val val 


val 








391/131 




TCC 


GGG 


TCG 


CAG CAT 


CGT 


ser 


gly 


ser 


gin his 


arg 


GAC 


CAC 


GAT 


C 




asp 


his 


asp 







SEQ ID N° 27A 
FIGURE 27A 



GAG TAG CGC CCA TGG GCT TGA 
glu AMB arg pro trp ala OPA 

ACC AGC GAC GGC CCG TGG TTG 
thr ser asp gly pro trp leu 

GTA CCG TTG TTG CCA CTT GAT 
val pro leu leu pro leu asp 

GAC ACT GGG ATC CTC AAA ACG 
asp thr gly ile leu lys thr 

ATC ACC ATG TAC GAA CTG AAT 
ile thr met tyr glu leu asn 

TCG GTT GAG GCC GAG GCG AGG 
ser val glu ala glu ala arg 

TGC GGC GAT CGC GGC GCA GTC 
cys gly asp arg gly ala val 



CTA CCA GCA AGA GCC CAG GGC 
leu pro ala arg ala gin gly 
61/21 

CCA ATT TTC CTT CCG CCC CGT 
pro ile phe leu pro pro arg 
121/41 

GGT CGC GCA GCT TGC GGA AAC 
gly arg ala ala cys gly asn 
181/61 

TCG TCG CTC TCC ACC CGT CGG 
ser ser leu ser thr arg arg 
241/81 

CGG CTG AGT GTC TGC AGG GCT 
arg leu ser val cys arg ala 
301/101 

AGT CCC CCC CGC GCG ACT TCC 
ser pro pro arg ala thr ser 
361/121 

TCA TTT CGC AGC AAG CGG TCT 
ser phe arg ser lys arg ser 
421/141 

TCG GAC GAG TCG TCG TCA ACG 
ser asp glu ser ser ser thr 









31/11 




TTC 


ACA 


GGA 


CCT AAA 


AGG 


phe 


thr 


gly 


pro lys 


arg 








91/31 




GCA 


ATA 


CCA 


TCT GCA 


AGA 


ala 


ile 


pro 


ser ala 


arg 








151/51 




GGG 


GTA 


TGG 


ACC CTG 


CCG 


gly val 


trp 


thr leu 


pro 








211/71 




GGG 


GCG 


AAA 


GCC ATT 


CCG 


gly ala 


lys 


ala ile 


pro 








271/91 




CCG 


GGG 


AGC 


AGC CGA 


TCA 


pro 


gly 


ser 


ser arg 


ser 








331/111 




AGA 


CAT 


TTG 


TTG TGG 


TTT 


arg 


his 


leu 


leu trp phe 








391/131 




CCG 


GGT 


CGC 


AGC ATC 


GTT 


pro 


gly 


arg 


ser ile 


val 


ACC 


ACG 


ATC 






thr 


thr 


ile 







SEQ ID N° 27B 



AGT AGC GCC CAT GGG CTT GAT 
ser ser ala his gly leu asp 

CCA GCG ACG GCC CGT GGT TGC 
pro ala thr ala arg gly cys 

TAC CGT TGT TGC CAC TTG ATG 
tyr arg cys cys his. leu met 

ACA CTG GGA TCC TCA AAA CGT 
thr leu gly ser ser lys arg 

TCA CCA TGT ACG AAC TGA ATA 
ser pro cys thr asn OPA ile 

CGG TTG AGG CCG AGG CGA GGC 
arg leu arg pro arg arg gly 

GCG GCG ATC GCG GCG CAG TCG 
ala ala ile ala ala gin ser 



FEUILLE DE REM&4£Ej|flEf^yREGLE 26) 



WO 99/09186 



PCT/FR98/01813 



94/185 



















n/1 1 

O ~J / 11 
















TAC CAG 


CAA 


GAG 


CCC 


AGG GCT 


TCA 


CAG 


GAC 


CTA AAA 


GGA GTA 


GCG 


CCC 


ATG 


GGC 


TTG 


ATC 


fur ff 1 n 
u.y i y in 


gin 


glu 


pro 


ox. \j ax>ci 


ser 


gin 


asp 


leu lys 


rr 1 v va 1 

y x. y vox 


ala 


pro 


met 


gxy 


1 All 
1CU 


11C 


v J/ ^ X 
















93/31 
















PAA TTT 

XXX 


TCC 


TTC 


CGC 


CCC GTG 

WW\* VJ X >J 


CAA 


TAC 


CAT 


CTG CAA 


GAC CAG 


CGA CGG CCC 


GTG 


GTT 

\3 1 1 


GCG 


f» 1 n nh& 

yill ^*iC 


S6X7 


phe 


arg 


pro val 


gin 


tvr 
uy i 


his 


leu gin 


a on rr 1 n 


arg 


arg 


pro 


val 

v d i 


va 1 
vai 


a 1 a 
did 


XCfJ f T 1 
















153/51 
















GTC GCG 


CAG 


CTT 


GCG 


GAA ACG 


GGG 


TAT 


GGA 


CCC TGC 


CGT ACC 


GTT 


GTT 


GCC 


ACT 


TGA 


TGT 


t/a 1 ala 


gin 


leu 


ala 


^XU 1*111 


n 1 v 
yiy 


tvr 
uy i. 


y iy 




dx,y win 


val 


val 


ala 


t-h r 


OPA 


cys 


10 0/ OX 
















£, X<Jf t 1 
















CGT CGC 


TCT 


CCA 


CCC 


GTC GGG 


GGG 


CGA 


AAG 


CCA TTC 


CGA CAC 


TGG 


GAT 


CCT 


CAA 


AAC 


GTC 


a m a r*ri 
ai^ aiy 


cay 


n m 
pi u 


iJ X> \J 


va 1 rr 1 v 

vax y i y 


gxy 


dx> y 


xya 


pro phe 


arg his 


trp 


asp 


pro 


gin 


asn 


val 


















273/91 
















GGC TGA 


GTG 




GCA 


GGG CTC 


CGG 


GGA 


GCA 


GCC GAT 


CAT CAC 


CAT 


GTA 


CGA 


ACT 


GAA 


TAA 


gxy Utn 


Vol 


car 


did 


y x y ic u 


a T*rr 
a i y 


rrl v 

gxy 


al a 
aid 


ala asp 


his his 


his 


val 


arg 


thr 


glu OCH 


JUJ/ 1U1 
















333/111 
















GTC CCC 


CCC 


GCG 


CGA 


CTT CCA 


GAC 


ATT 


TGT 


TGT GGT 


TTC GGT 


TGA 


GGC 


CGA 


GGC 


GAG 


GCT 


val pro 


pro 


ala 


arg 


leu pro 


asp 


ile 


cys 


cys gly phe gly 


OPA gly arg gly 


glu 


ala 


363/121 
















393/131 
















CAT TTC 


GCA 


GCA 


AGC 


GGT CTC 


CGG 


GTC 


GCA 


GCA TCG 


TTG CGG 


CGA 


TCG 


CGG 


CGC 


AGT 


CGT 


his phe 


ala 


ala 


ser 


gly leu 


arg 


val 


ala 


ala ser 


leu arg 


arg 


ser 


arg 


arg 


ser 


arg 


423/141 
































CGG ACG 


AGT 


CGT 


CGT 


CAA CGA 


CCA 


CGA 


TC 


















arg thr 


ser 


arg 


arg 


gin arg 


pro 


arg 





















SEQ ID N° 27C 
FIGURE 27C 



MKT GTATT RRRLLAVLI ALAL P GAAVALLAE P SATGAS D P CAAS EVAR 
TVGSVAKSMGDYLDSHPETNQVMTAVLQQQVGPGSVASLKAHFEANPK 
VASDLHALSQPLTDLSTRCSLPISGLQAIGLMQAVQGARR 



SEQ ID N° 28 
FIGURE 28 



GTGGGCAAGC AGCTAGCCGC GCTCGCCGCG CTGGTCGGTG CGTGCATGCT CGCAGCCGGA 60 

TGCACCAACG TGGTCGACGG GACCGCCGTG GCTGCCGACA AATCCGGACC ACT GC AT CAG 120 

GATCCGATAC CGGTTTCAGC GCTTGAAGGG CTGCTTCTCG ACTTGAGCCA GATCAATGCC 180 

GCGCTGGGTG CGACATCGAT GAAGGTGTGG TTCAACGCCA AGGCAATGTG GGACTGGAGC 24 0 

AAGAGCGTGG CCGACAAGAA TTGCCTGGCT ATCGACGGTC CAGCACAGGA AAAGGTCTAT 300 

GCCGGCACCG GGTGGACCGC TATGCGCGGC CAACGGCTGG ATGACAGCAT CGATGACTCC 360 

AAGAAACGCG ACCACTACGC CATTCAAGCG GTCGTCGGCT TCCCGACCGC ACATGATGCC 420 

GAGGAGTTCT ACAGCTCCTC GGTGCAAAGC TGGAGCAGCT GCTCGAACCG CCGGTTTGTC 480 

GAAGTCACCC CCGGACAGGA CGACGCCGCC TGGACTGTGG CTGACGTTGT CAACGACAAC 540 

GGCATGCTCA GTAGCTCGCA GGTTCAGGAA GGCGGCGACG GATGGACCTG CCAGCGTGCC 600 

CTGACTGCGC GCAACAACGT CACTATCGAC AT TGT CAC GT GCGCCTATAG CCAACCGGAT 660 

TTGGTGGCGA TTGGCATCGC TAACCAAATC GCGGCCAAGG TTGCTAAGCA GTAG 714 



SEQ ID N° 29 
FEUILLE DE REMPO©BMEWP(REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



95/185 



MGKQLAALAALVGACMLAAGCT 

NfKVWFNAKAMWDWSKSVADKNCLAI DGPAQEKVYAGTGFTWTAMRGQRLDDS I DDS KKRDHYAIQAW 
GFPTAHDAEEFYSSSVQSWSSCSNRRFVEVTFTPGQDDAAWTVADWNDNGMLSSSQVQEGGDGWTCQ 
RALTARNNVTIDIVTCAYSQPDLVFTAIGIANQIAAKVAKQ 



SEQ ID N° 30 
FIGURE 30 



1/1 31/11 



AGG CGA 


ATA 


CCC 


GCG 


AGG 


GCA GCG 


CGA CGG 


CGG CCC 


TGC 


CGG 


CGC 


CGT 


GGC 


TGC 


TGA 


ACA 


arg arg 
61/21 


ile 


pro 


ala 


arg 


ala ala 


arg arg 


arg pro 
91/31 


cys 


arg 


arg 


arg 


gly 


cys 


OPA 


thr 


ACA CAT 


CCC 


AGC 


CGC 


GCA 


CGC TTC 


CGG TAT 


GCG GCA 


GGA 


TAA 


ACG 


ACC 


CCA 


ACA 


GCA 


CGA 


thr his 
121/41 


pro 


ser 


arg 


ala 


arg phe 


arg tyr 


ala ala 
151/51 


gly 


OCH 


tnr 


tnr 


pro 


thr 


ala 


arg 


ACA CCA 


GGA 


TTG 


CGA 


CAA 


CCA AAG 


CCC TCG 


CGC CTG 


GCT 


CGA 


TTT 


CGC 


GCG 


CAA 


CGC 


GGC 


thr pro 
181/61 


gly leu arg gin 


pro lys 


pro ser 


arg leu 
211/71 


ala 


arg 


pne 


arg 


ala 


gin 


arg 


gly 


GTT CTG 


CCG 


CCT 


CGA 


TCT 


CAG CGC 


GGA GGG 


CGT CGA 


GAT 


C 














val leu 


pro 


pro 


arg 


ser 


gin arg gly gly 


arg arg 


asp 




























SEQ ID 


N° 31A 




























FIGURE 31A 


















1/1 














31/11 


















GGC GAA 


TAC 


CCG 


CGA 


GGG 


CAG CGC 


GAC GGC 


GGC CCT 


GCC 


GGC 


GCC 


GTG 


GCT 


GCT 


GAA 


CAA 


gly glu tyr pro 
61/21 


arg 


gly 


gin arg 


asp gly 


gly pro 
91/31 


ala 


gly 


ala 


val 


ala 


ala 


glu 


gin 


CAC ATC 


CCA 


GCC 


GCG 


CAC 


GCT TCC 


GGT ATG 


CGG CAG 


GAT 


AAA 


CGA 


CCC 


CAA 


CAG 


CAC 


GAA 


his ile 
121/41 


pro 


ala 


ala 


his 


ala ser 


gly met 


arg gin 
151/51 


asp 


lys 


arg 


pro 


gin 


gin 


his 


glu 


CAC CAG 


GAT 


TGC 


GAC 


AAC 


CAA AGC 


CCT CGC 


GCC TGG 


CTC 


GAT 


TTC 


GCG 


CGC 


AAC 


GCG 


GCG 


his gin asp 
181/61 


cys 


asp 


asn 


gin ser 


pro arg 


ala trp 
211/71 


leu 


asp 


phe 


ala 


arg 


asn 


ala 


ala 


TTC TGC 


CGC 


CTC 


GAT 


CTC 


AGC GCG 


GAG GGC 


GTC GAG 


ATC 
















phe cys 


arg 


leu 


asp 


leu 


ser ala 


glu gly 


val glu 


ile 

















SEQ ID N° 31B 
FIGURE 31B 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



96/185 

1/1 31/11 

GCG AAT ACC CGC GAG GGC AGC GCG ACG GCG GCC CTG CCG GCG CCG TGG CTG CTG AAC AAC 
ala asn thr arg glu gly ser ala thr ala ala leu pro ala pro trp leu leu asn asn 
61/21 91/31 

ACA TCC CAG CCG CGC ACG CTT CCG GTA TGC GGC AGG ATA AAC GAC CCC AAC AGC ACG AAC 
thr ser gin pro arg thr leu pro val cys gly arg ile asn asp pro asn ser thr asn 
121/41 151/51 

ACC AGG ATT GCG ACA ACC AAA GCC CTC GCG CCT GGC TCG ATT TCG CGC GCA ACG CGG CGT 
thr arg ile ala thr thr lys ala leu ala pro gly ser ile ser arg ala thr arg arg 
181/61 211/71 
TCT GCC GCC TCG ATC TCA GCG CGG AGG GCG TCG AGA TC 
ser ala ala ser ile ser ala arg arg ala ser arg 



SEQ ID N° 31C 
FIGURE 31C 



ORF d'apres Cole et al . (Nature 393:537-544) et contenant seq31A 
1/1 31/11 

taa acg acc cca aca gca cga aca cca gga ttg cga caa cca aag ccc teg cgc ctg get 
OCH thr thr pro thr ala arg thr pro gly leu arg gin pro lys pro ser arg leu ala 
61/21 91/31 

cga ttt cgc gcg caa cgc ggc gtt ctg ccg cct cga tct cag cgc gga ggg cgt cga gat 
arg phe arg ala gin arg gly val leu pro pro arg ser gin arg gly gly arg arg asp 
121/41 151/51 

ccc egg cgt cgt gtt cgt ggc tea tea tct gca tec tec ggg ctt ggc cgc get gac egg 
pro arg arg arg val arg gly ser ser ser ala ser ser gly leu gly arg ala asp arg 
181/61 211/71 

cag ccc gac ccc agg cat gee cag gee gac ggc gcg ccc egg ctg ccc ggc ggt gtg cgc 
gin pro asp pro arg his ala gin ala asp gly ala pro arg leu pro gly gly val arg 
241/81 271/91 

gtc gec ggc gcg ggt gcg gcg gtg ggt cag gac gec ggc gtc ggc gat gag gtg gtg egg 
val ala gly ala gly ala ala val gly gin asp ala gly val gly asp glu val val arg 
301/101 331/111 

cgc cgc ttc ggt gac ctt cgt ggt gat gac gtc gee ggg acg cac gcg egg ctg gee ggc 
arg arg phe gly asp leu arg gly asp asp val ala gly thr his ala arg leu ala gly 
361/121 391/131 

ggt gaa gtg cac cag gcg ccc gtc gcg cgc ccg ccc get cat gcg cgc cgt gac ggt gtc 
gly glu val his gin ala pro val ala arg pro pro ala his ala arg arg asp gly val 
421/141 451/151 

ctt gcg ccc ttc ccc ggt ggc cac cag cac etc gac ggc ctg ccc gac cag ggc gcg gtt 
leu ala pro phe pro gly gly his gin his leu asp gly leu pro asp gin gly ala val 
481/161 511/171 

ggc ttc cag cga gat ttg etc ctg cag cgc gat cag gcg ttc ata gcg ttc ctg cac aac 
gly phe gin arg asp leu leu leu gin arg asp gin ala phe ile ala phe leu his asn 
541/181 571/191 

ggc ttt egg cag ctg tec gtc gag ttg cgc ggc egg tgt ccc ggg ccg ctt gga gta ttg 
gly phe arg gin leu ser val glu leu arg gly arg cys pro gly pro leu gly val leu 
601/201 631/211 

gaa ggt aaa tgc ggc cgc gaa gcg ggc ccg gcg cac cac gtc gag cgt ggc cgc gaa gtc 
glu gly lys cys gly arg glu ala gly pro ala his his val glu arg gly arg glu val 
661/221 691/231 

etc ttc ggt etc ccc ggg gaa acc gac gat cag ate ggt ggt aat cgc ggc atg egg gat 
leu phe gly leu pro gly glu thr asp asp gin ile gly gly asn arg gly met arg asp 
721/241 751/251 

ggc cgc ccg cac gcg etc gat gat gee gag gta gcg etc ggc acg ata gga ccg ccg cat 
gly arg pro his ala leu asp asp ala glu val ala leu gly thr ile gly pro Dro his 
781/261 811/271 
cgc gcg cag gat ccg gtc gga tec gga ctg tag 
arg ala gin asp pro val gly ser gly leu AMB 



SEQ ID N° 31F 
FEUILLE DE REMPEA6EMEttJF(REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



97/185 



1/1 

aga ctg gtg tac acg gag acc 
arg leu val tyr thr glu thr 
61/21 

eta gtg aag gtc att cag aaa 
leu val lys val ile gin lys 
121/41 

ttc gtc ggt ttc gcg egg atg 
phe val gly phe ala arg met 
181/61 

ccg ttg egg gac tac gaa ctg 
pro leu arg asp tyr glu leu 
241/81 

ggg ccg acc gcg ctg aac tat 
gly pro thr ala leu asn tyr 
301/101 

tac ggg cgc ate aaa cgc cag 
tyr gly arg ile lys arg gin 









31/11 




aag 


ctg 


aac 


ten nra 
w y y v^o 


ttc 


lys 


leu 


asn 


SCi aid 










91/31 




ctg 


teg 


acre 
y y k - 


ttg age 


ate 


leu 


ser 


yxy 


leu ser 


i 1 a 

■L1C 








151/51 




gtc 


gag 


gec 


etc ctac 


yy u 


val glu 


ala 


leu gly 


yxy 








211/71 




ggc 


acg 


gtg 


ctg gag 


cac 


gly thr 


val 


leu glu 


his 








271/91 




gtg 


cgc 


get 


cgc cag 


gtc 


val 


arg 


ala 


arg gin 


val 








331/111 




cag 


ttg 


ttt 


ttg teg 


teg 


gin 


leu 


phe 


leu ser 


ser 



SEQ ID N° 32A 
FIGURE 32A 



tec ttc ggc ggg cct aag tgt 
ser phe gly gly pro lys cys 

aac egg ttc ate gcg att gac 
asn arg phe ile ala ile asp 

gtc gag gta tgc age acc acc 
val glu val cys ser thr thr 

gee gga cgc cag gtc att gac 
ala gly arg gin val ile asp 

acc acc gag age aat ggc gac 
thr thr glu ser asn gly asp 

ctg ctg cgt teg atg ate 
leu leu arg ser met ile 



1/1 

gac tgg tgt aca egg aga cca 
asp trp cys thr arg arg pro 
61/21 

tag tga agg tea ttc aga aac 
AMB OPA arg ser phe arg asn 
121/41 

teg teg gtt teg cgc gga tgg 
ser ser val ser arg gly trp 
181/61 

cgt tgc ggg act acg aac tgg 
arg cys gly thr thr asn trp 
241/81 

ggc cga ccg cgc tga act atg 
gly arg pro arg OPA thr met 
301/101 

acg ggc gca tea aac gee age 
thr gly ala ser asn ala ser 









31/11 




age 


tga 


act 


egg cat 


tct 


ser 


OPA 


thr 


arg his 


ser 








91/31 




tgt 


egg 


get 


tga gca 


tea 


cys 


arg 


ala 


OPA ala 


ser 








151/51 




teg 


agg 


ccc 


teg gcg 


gcg 


ser 


arg 


pro 


ser ala 


ala 








211/71 




gca 


egg 


tgc 


tgg age 


acg 


ala 


arg 


cys 


trp ser 


thr 








271/91 




tgc 


gcg 


etc 


gee agg 


tea 


cys 


ala 


leu 


ala arg 


ser 








331/111 




agt 


tgt 


ttt 


tgt cgt 


cgc 


ser 


cys 


phe 


cys arg 


arg 



SEQ ID N° 32B 
FIGURE 32B 



cct teg gcg ggc eta agt gtc 
pro ser ala gly leu ser val 

acc ggt tea teg cga ttg act 
thr gly ser ser arg leu thr 

teg agg tat gca gca cca ccc 
ser arg tyr ala ala pro pro 

ccg gac gec agg tea. ttg acg 
pro asp ala arg ser leu thr 

cca ccg aga gca atg gcg act 
pro pro arg ala met ala thr 

tgc tgc gtt cga tga tc 
cys cys val arg OPA 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



98/185 



1/1 31/11 

act ggt gta cac gga gac caa get gaa etc ggc att etc ctt egg egg gee taa gtg tct 
thr gly val his gly asp gin ala glu leu gly ile leu leu arg arg ala OCH val ser 
61/21 91/31 

agt gaa ggt cat tea gaa act gtc ggg ctt gag cat caa ccg gtt cat cgc gat tga ctt 
ser glu gly his ser glu thr val gly leu glu his gin pro val his arg asp OPA leu 
121/41 151/51 

cgt egg ttt cgc gcg gat ggt cga ggc cct egg egg cgt cga ggt atg cag cac cac ccc 
arg arg phe arg ala asp gly arg gly pro arg arg arg arg gly met gin his his pro 
181/61 211/71 

gtt gcg gga eta cga act ggg cac ggt get gga gca cgc egg acg cca ggt cat tga egg 
val ala gly leu arg thr gly his gly ala gly ala arg arg thr pro gly his OPA arg 
241/81 271/91 

gec gac cgc get gaa eta tgt gcg cgc teg cca ggt cac cac cga gag caa tgg cga eta 
ala asp arg ala glu leu cys ala arg ser pro gly his his arg glu gin trp arg leu 
301/101 331/111 

egg gcg cat caa acg cca gca gtt gtt ttt gtc gtc get get gcg ttc gat gat c 
arg ala his gin thr pro ala val val phe val val ala ala ala phe asp asp 

SEQ ID N° 32C 
FIGURE 32C 



sequence Rv0822c predite par Cole et al. 
1/1 

atg agt gac ggc gag age gec gcg ccg tgg 
Met ser asp gly glu ser ala ala pro trp 
61/21 

ggt gtt gac cga tgg ate acg gta ccg ccc 
gly val asp arg trp ile thr val pro pro 
121/41 

gac acc cag aat gtc ggc tgt cat gee acc 
asp thr gin asn val gly cys his ala thr 
181/61 

agg etc ggc ccc get ttt cct gac etc ccc 
arg leu gly pro ala phe pro asp leu pro 
241/81 

cca tec ggc cgc ggc ccg aag gtc cac gac 
pro ser gly arg gly pro lys val his asp 
301/101 

ate gec ate ccg gee cac teg etc gag ttc 
ile ala ile pro ala his ser leu glu phe 
361/121 

aac tat ccg cgc gee gac cac gec cgc cgt 
asn tyr pro arg ala asp his ala arg arg 
421/141 

gga teg get cga gtg egg cca ttg egg ate 
gly ser ala arg val arg pro leu arg ile 
481/161 

gcg ccg aac tec ggc egg cgc ccg atg gtg 
ala pro asn ser gly arg arg pro met val 
541/181 

gee get ctg gcg ttg gcg ctg acc ggc ggg 
ala ala leu ala leu ala leu thr gly gly 
601/201 

egg ctg aac atg gta age gcg etc gac ccg 
arg leu asn met val ser ala leu asp pro 



(Nature 393:537-544) et contenant seq 32A 
31/11 

gca egg etc tec gag tea gca ttc ccc gat 
ala arg leu ser glu ser ala phe pro asp 
91/31 

gee aca tgg gtg gca gec cag ggt ccg egg 
ala thr trp val ala ala gin gly pro arg 
151/51 

ggc gee gtt agt gtg gee gat ctg ate gec 
gly ala val ser val ala asp leu ile ala 
211/71 

acg cac cgc cat gtc gee ccc gaa ccc gag 
thr his arg his val ala pro glu pro glu 
271/91 

gac gec gac gac cag cag gac acc gag get 
asp ala asp asp gin gin asp thr glu ala 
331/111 

etc teg gag ctt ccc gac etc egg gca gee 
leu ser glu leu pro asp leu arg ala ala 
391/131 

gaa ccc gag eta ccc ggc aag cag eta acc 
glu pro glu leu pro gly lys gin leu thr 
451/151 

cgc cga acg teg ccc gcg ccc gec aag cca 
arg arg thr ser pro ala pro ala lys pro 
511/171 

ctg gec gcg cgc teg ctg gcg get ctg ttt 
leu ala ala arg ser leu ala ala leu phe 
571/191 

gca tgg cag tgg age gcg teg aag aac age 
ala trp gin trp ser ala ser lys asn ser 
631/211 

cat teg ggc gac ate gtc aac ccc age ggg 
his ser gly asp ile val asn pro ser gly 



SEQ ID N° 32D 



FEUILLE DE REMP££^eN^REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



99/185 



661/221 

cag cat ggc gac gag aac ttc ttg etc gtc 
gin his gly asp glu asn phe leu leu val 
721/241 

aat ate ggc gec ggc gac gec gag gac gec 
asn ile gly ala gly asp ala glu asp ala 
781/261 

gtc aac att ccg gec age cgc gag egg gtc 
val asn ile pro ala ser arg glu arg val 
841/281 

ate act cca ate caa tgc gag gcg tgg aac 
ile thr pro ile gin cys glu ala trp asn 
901/301 

gac gag aag acg gga acg atg ggt ccc aga 
asp glu lys thr gly thr met gly pro arg 
961/321 

gca ttc tec ttc ggc ggg cct aag tgt eta 
ala phe ser phe gly gly pro lys cys leu 
1021/341 

age ate aac egg ttc ate gcg att gac ttc 
ser ile asn arg phe ile ala ile asp phe 
1081/361 

ggc ggc gtc gag gta tgc age acc ace ccg 
gly gly val glu val cys ser thr thr pro 
1141/381 

gag cac gee gga cgc cag gtc att gac ggg 
glu his ala gly arg gin val ile asp gly 
1201/401 

cag gtc acc acc gag age aat ggc gac tac 
gin val thr thr glu ser asn gly asp tyr 
1261/421 

teg teg ctg ctg cgt teg atg ate teg acg 
ser ser leu leu arg ser met ile ser thr 
1321/441 

aac gtc gtc aac atg ttc ate ggt aac age 
asn val val asn met phe ile gly asn ser 
1381/461 

gtc gaa etc ggt cga teg ttg cag cat atg 
val glu leu gly arg ser leu gin his met 
1441/481 

ccg acc ggt ata acc gac cag aac ggc gac 
pro thr gly ile thr asp gin asn gly asp 
1501/501 

ctt ttc acc gec ate ate gac gac gat ccg 
leu phe thr ala ile ile asp asp asp pro 
1561/521 

cgt ctg ggc aac acg ccg teg acc ccg ccg 
arg leu gly asn thr pro ser thr pro pro 
1621/541 

ctg acc aac gag att cag cac cag cag gtt 
leu thr asn glu ile gin his gin gin val 
1681/561 

cag gtc tct aac teg acc ggc cag gee ggt 
gin val ser asn ser thr gly gin ala gly 
1741/581 

egg aac ggc ttc aac gtg atg get ccg gac 
arg asn gly phe asn val met ala pro asp 
1801/601 

gtg ttt ttt teg ccc ggc aac gaa cag get 
val phe phe ser pro gly asn glu gin ala 
1861/621 

tea aag ate gag egg gtg acc ggg ate ggc 
ser lys ile glu arg val thr gly ile gly 



691/231 

ggt atg gac tct cgt gee ggg gcg aac gec 
gly met asp ser arg ala gly ala asn ala 
751/251 

ggc ggc gca cgt teg gac acc gtc atg ctg 
gly gly ala arg ser asp thr val met leu 
811/271 

gtc gcg gtg teg ttc ccc cgc gac ctg gcg 
val ala val ser phe pro arg asp leu ala 
871/291 

ccc gag acc ggt aag tac gga ccc ate tac 
pro glu thr gly lys tyr gly pro ile tyr 
931/311 

ctg gtg tac acg gag acc aag ctg aac teg 
leu val tyr thr glu thr lys leu asn ser 
991/331 

gtg aag gtc att cag aaa ctg teg ggc ttg 
val lys val ile gin lys leu ser gly leu 
1051/351 

gtc ggt ttc gcg egg atg gtc gag gec etc 
val gly phe ala arg met val glu ala leu 
1111/371 

ttg egg gac tac gaa ctg ggc acg gtg ctg 
leu arg asp tyr glu leu gly thr val leu 
1171/391 

ccg acc gcg ctg aac tat gtg cgc get cgc 
pro thr ala leu asn tyr val arg ala arg 
1231/411 

ggg cgc ate aaa cgc cag cag ttg ttt ttg 
gly arg ile lys arg gin gin leu phe leu 
1291/431 

gac acc ttg ttc aac etc age agg etc aac 
asp thr leu phe asn leu ser arg leu asn 
1351/451 

tac gtg gac aac gtc aag acc aaa gac ctg 
tyr val asp asn val lys thr lys asp leu 
1411/471 

gcg gec ggg cac gtc acg ttc gtg acc gtt 
ala ala gly his val thr phe val thr val 
1471/491 

gag ccc ccg cgt acc tec gac atg aag gcg 
glu pro pro arg thr ser asp met lys ala 
1531/511 

ctg ccc ctg gaa aac gat cac aac gec cag 
leu pro leu glu asn asp his asn ala gin 
1591/531 

acc acc acc aag aag gcg ccg cag gcg ggt 
thr thr thr lys lys ala pro gin ala gly 
1651/551 

acg acg acc teg cca aaa gag gtc aca gtg 
thr thr thr ser pro lys glu val thr val 
1711/571 

ttg gec acc acc gec acc gat cag etc aag 
leu ala thr thr ala thr asp gin leu lys 
1771/591 

gac tac ccg agt teg ctg ctg gee acc aca 
asp tyr pro ser ser leu leu ala thr thr 
1831/611 

gec gec acc gtg gec gec gtg ttc ggc cag 
ala ala thr val ala ala val phe gly gin 
1891/631 

caa ctg gtc cag gtg gtg ctg ggc caa gac 
gin leu val gin val val leu gly gin asp 



SEQ ID N° 32D (suite 1) 



FEUILLE DE ^iWA^lfl^t^LE 26) 



WO 99/09186 



PCT/FR98/01813 



100/185 



1921/641 

ttc age gcg gtg cgc 

phe ser ala val arg 
1981/661 

aac tec tec age cca 

asn ser ser ser pro 
2041/681 

ace acc tgc gag tag 

thr thr cys glu AMB 



get ccc ctg ccg agt 
ala pro leu pro ser 

ccg acc aag ctg ccc 
pro thr lys leu pro 



1951/651 

ggc tec acc gtc age 
gly ser thr val ser 
2011/671 

gag gae ctg aeg gtc 
glu asp leu thr val 



gtg cag ata age cgc 
val gin ile ser arg 

acc aac gee gec gae 
thr asn ala ala asp 



SEQ ID N° 32D (suite 2) 
FIGURE 32D (suite 2) 



ORF d'apres Cole 
1/1 

tag gae atg agt 
AMB asp met ser 
.61/21 

ccc gat ggt gtt 
pro asp gly val 
121/41 

ccg egg gae acc 
pro arg asp thr 
181/61 

ate gee agg etc 
ile ala arg leu 
241/81 

ccc gag cca tec 
pro glu pro ser 
301/101 

gag get ate gee 
glu ala ile ala 
361/121 

gca gee aac tat 
ala ala asn tyr 
421/141 

eta acc gga teg 
leu thr gly ser 
481/161 

aag cca gcg ccg 
lys pro ala pro 
541/181 

ctg ttt gee get 
leu phe ala ala 
601/201 

aac age egg ctg 
asn ser arg leu 
661/221 

age ggg cag cat 
ser gly gin his 
721/241 

aac gee aat ate 
asn ala asn ile 
781/261 

atg ctg gtc aac 
met leu val asn 



et al. (Nature 



gae ggc gag age 
asp gly glu ser 

gae cga tgg ate 
asp arg trp ile 

cag aat gtc ggc 
gin asn val gly 

ggc ccc get ttt 
gly pro ala phe 

ggc cgc ggc ccg 
gly arg gly pro 

ate ccg gee cac 
ile pro ala his 

ccg cgc gee gae 
pro arg ala asp 

get cga gtg egg 
ala arg val arg 

aac tec ggc egg 
asn ser gly arg 

ctg gcg ttg gcg 
leu ala leu ala 

aac atg gta age 
asn met val ser 

ggc gae gag aac 
gly asp glu asn 

ggc gee ggc gae 
gly ala gly asp 

att ccg gee age 
ile pro ala ser 



393:537-544) et 

31/11 
gee gcg ccg tgg 
ala ala pro trp 

91/31 
aeg gta ccg ccc 
thr val pro pro 

151/51 
tgt cat gee acc 
cys his ala thr 

211/71 
cct gae etc ccc 
pro asp leu pro 

271/91 
aag gtc cac gae 
lys val his asp 
331/111 
teg etc gag ttc 
ser leu glu phe 
391/131 
cac gec cgc cgt 
his ala arg arg 
451/151 
cca ttg egg ate 
pro leu arg ile 
511/171 
cgc ccg atg gtg 
arg pro met val 
571/191 
ctg acc ggc ggg 
leu thr gly gly 
631/211 
gcg etc gae ccg 
ala leu asp pro 
691/231 
ttc ttg etc gtc 
phe leu leu val 
751/251 
gec gag gae gec 
ala glu asp ala 
811/271 
cgc gag egg gtc 
arg glu arg val 



contenant 



gca egg etc tec 
ala arg leu ser 

gee aca tgg gtg 
ala thr trp val 

ggc gee gtt agt 
gly ala val ser 

aeg cac cgc cat 
thr his arg his 

gae gec gae gae 
asp ala asp asp 

etc teg gag ctt 
leu ser glu leu 

gaa ccc gag eta 
glu pro glu leu 

cgc cga aeg teg 
arg arg thr ser 

ctg gee gcg cgc 
leu ala ala arg 

gca tgg cag tgg 
ala trp gin trp 

cat teg ggc gae 
his ser gly asp 

ggt atg gae tct 
gly met asp ser 

ggc ggc gca cgt 
gly gly ala arg 

gtc gcg gtg teg 
val ala val ser 



.c 



gag tea gca ttc 
glu ser ala phe 

gca gec cag ggt 
ala ala gin gly 

gtg gee gat ctg 
val ala asp leu 

gtc gec ccc gaa 
val ala pro glu 

cag cag gae acc 
gin gin asp thr 

ccc gae etc egg 
pro asp leu arg 

ccc ggc aag cag 
pro gly lys gin 

ccc gcg ccc gec 
pro ala pro ala 

teg ctg gcg get 
ser leu ala ala 

age gcg teg aag 
ser ala ser lys 

ate gtc aac ccc 
ile val asn pro 

cgt gee ggg gcg 
arg ala gly ala 

teg gae acc gtc 
ser asp thr val 

ttc ccc cgc gae 
phe pro arg asp 



SEQ ID N° 32F 



FEUILLE DE REIM^^g^lE^REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



841/281 

ctg gcg ate act cca ate caa tgc gag gcg 
leu ala ile thr pro ile gin cys glu ala 
901/301 

ate tac gac gag aag acg gga acg atg ggt 
ile tyr asp glu lys thr gly thr met gly 
961/321 

aac teg gca ttc tec ttc ggc ggg cct aag 
asn ser ala phe ser phe gly gly pro lys 
1021/341 

ggc ttg age ate aac egg ttc ate gcg att 
gly leu ser ile asn arg phe ile ala ile 
1081/361 

gec etc ggc ggc gtc gag gta tgc age acc 
ala leu gly gly val glu val cys ser thr 
1141/381 

gtg ctg gag cac gec gga cgc cag gtc att 
val leu glu his ala gly arg gin val ile 
1201/401 

get cgc cag gtc acc acc gag age aat ggc 
ala arg gin val thr thr glu ser asn gly 
1261/421 

ttt ttg teg teg ctg ctg cgt teg atg ate 
phe leu ser ser leu leu arg ser met ile 
1321/441 

etc aac aac gtc gtc aac atg ttc ate ggt 
leu asn asn val val asn met phe ile gly 
1381/461 

gac ctg gtc gaa etc ggt cga teg ttg cag 
asp leu val glu leu gly arg ser leu gin 
1441/481 

acc gtt ccg acc ggt ata acc gac cag aac 
thr val pro thr gly ile thr asp gin asn 
1501/501 

aag gcg ctt ttc acc gee ate ate gac gac 
lys ala leu phe thr ala ile ile asp asp 
1561/521 

gee cag cgt ctg ggc aac acg ccg teg acc 
ala gin arg leu gly asn thr pro ser thr 
1621/541 

gcg ggt ctg acc aac gag att cag cac cag 
ala gly leu thr asn glu ile gin his gin 
1681/561 

aca gtg cag gtc tct aac teg acc ggc cag 
thr val gin val ser asn ser thr gly gin 
1741/581 

etc aag egg aac ggc ttc aac gtg atg get 
leu lys arg asn gly phe asn val met ala 
1801/601 

acc aca gtg ttt ttt teg ccc ggc aac gaa 
thr thr val phe phe ser pro gly asn glu 
1861/621 

ggc cag tea aag ate gag egg gtg acc ggg 
gly gin ser lys ile glu arg val thr gly 
1921/641 

caa gac ttc age gcg gtg cgc get ccc ctg 
gin asp phe ser ala val arg ala pro leu 
1981/661 

age cgc aac tec tec age cca ccg acc aag 
ser arg asn ser ser ser pro pro thr lys 
2041/681 

gee gac acc acc tgc gag tag 
ala asp thr thr cys glu AMB 



101/185 

871/291 

tgg aac ccc gag acc ggt aag tac gga ccc 
trp asn pro glu thr gly lys tyr gly pro 
931/311 

ccc aga ctg gtg tac acg gag acc aag ctg 
pro arg leu val tyr thr glu thr lys leu 
991/331 

tgt eta gtg aag gtc att cag aaa ctg teg 
cys leu val lys val ile gin lys leu ser 
1051/351 

gac ttc gtc ggt ttc gcg egg atg gtc gag 
a3p phe val gly phe ala arg met val glu 
1111/371 

acc ccg ttg egg gac tac gaa ctg ggc acg 
thr pro leu arg asp tyr glu leu gly thr 
1171/391 

gac ggg ccg acc gcg ctg aac tat gtg cgc 
asp gly pro thr ala leu asn tyr val arg 
1231/411 

gac tac ggg cgc ate aaa cgc cag cag ttg 
asp tyr gly arg ile lys arg gin gin leu 
1291/431 

teg acg gac acc ttg ttc aac etc age agg 
ser thr asp thr leu phe asn leu ser arg 
1351/451 

aac age tac gtg gac aac gtc aag acc aaa 
asn ser tyr val asp asn val lys thr lys 
1411/471 

cat atg gcg gee ggg cac gtc acg ttc gtg 
his met ala ala gly his val thr phe val 
1471/491 

ggc gac gag ccc ccg cgt acc tec gac atg 
gly asp glu pro pro arg thr ser asp met 
1531/511 

gat ccg ctg ccc ctg gaa aac gat cac aac 
asp pro leu pro leu glu asn asp his asn 
1591/531 

ccg ccg acc acc acc aag aag gcg ccg cag 
pro pro thr thr thr lys lys ala pro gin 
1651/551 

cag gtt acg acg acc teg cca aaa gag gtc 
gin val thr thr thr ser pro lys glu val 
1711/571 

gee ggt ttg gec acc acc gec acc gat cag 
ala gly leu ala thr thr ala thr asp gin 
1771/591 

ccg gac gac tac ccg agt teg ctg ctg gee 
pro asp asp tyr pro ser ser leu leu ala 
1831/611 

cag get gec gec acc gtg gee gee gtg ttc 
gin ala ala ala thr val ala ala val phe 
1891/631 

ate ggc caa ctg gtc cag gtg gtg ctg ggc 
ile gly gin leu val gin val val leu gly 
1951/651 

ccg agt ggc tec acc gtc age gtg cag ata 
pro ser gly ser thr val ser val gin ile 
2011/671 

ctg ccc gag gac ctg acg gtc acc aac gec 
leu pro glu asp leu thr val thr asn ala 



SEQ ID 32F (suite 1) 



FEUILLE SimpiiM^^ 26) 



WO 99/09186 



PCT/FR98/01813 



102/185 



1/1 

CGT CAC CTC TGC CAT 
arg his leu cys his 
61/21 

CAT GCA GAG TCG GTG 
his ala glu ser val 
121/41 

GGC CGA CAT TCG CCC 
gly arg his ser pro 
181/61 

ATT GAT ACG ATT GCG 
ile asp thr ile ala 



GGT CCA TCT ACG GTA 
gly pro ser thr val 

TTC GCT TCA CGC GAA 
phe ala ser arg glu 

GAG GCC TTG GCC TCC 
glu ala leu ala ser 

CAC ATG GCT ATC TGG 
his met ala ile trp 



31/11 

TCT GCG ACA AGG GCA 
ser ala thr arg ala 
91/31 

CTA GGC GCG CCT AGC 
leu gly ala pro ser 
151/51 

ATC ACC TAA TTG TGT 

ile thr OCH leu cys 

211/71 

GAT C 

asp 



GCG TCG ATC CCT CGA 
ala ser ile pro arg 

CTG GAC GAG TCC CCG 
leu asp glu ser pro 

GCA AAA CCG TAT CTA 
ala lys pro tyr leu 



SEQ ID N° 33A 
FIGURE 33A 



1/1 

GTC ACC TCT GCC ATG 
val thr ser ala met 
61/21 

ATG CAG AGT CGG TGT 
met gin ser arg cys 
121/41 

GCC GAC ATT CGC CCG 
ala asp ile arg pro 
181/61 

TTG ATA CGA TTG CGC 
leu ile arg leu arg 



GTC CAT CTA CGG TAT 
val his leu arg tyr 

TCG CTT CAC GCG AAC 
ser leu his ala asn 

AGG CCT TGG CCT CCA 
arg pro trp pro pro 

ACA TGG CTA TCT GGG 
thr trp leu ser gly 



31/11 

CTG CGA CAA GGG CAG 
leu arg gin gly gin 
91/31 

TAG GCG CGC CTA GCC 
AMB ala arg leu ala 
151/51 

TCA CCT AAT TGT GTG 

ser pro asn cys val 

211/71 

ATC 

ile 



CGT CGA TCC CTC GAC 
arg arg ser leu asp 

TGG ACG AGT CCC CGG 
trp thr ser pro arg 

CAA AAC CGT ATC TAA 
gin asn arg lie OCH 



SEQ ID N° 33B 
FIGURE 33B 



1/1 

CCG TCA CCT CTG 
pro ser pro leu 
61/21 

ACA TGC AGA GTC 
thr cys arg val 
121/41 

GGG CCG ACA TTC 
gly pro thr phe 
181/61 

AAT TGA TAC GAT 
asn OPA tyr asp 



CCA TGG TCC ATC 
pro trp ser ile 

GGT GTT CGC TTC 
gly val arg phe 

GCC CGA GGC CTT 
ala arg gly leu 

TGC GCA CAT GGC 
cys ala his gly 







31/11 


TAC 


GGT 


ATC TGC 


tyr 


gly 


ile cys 






91/31 


ACG 


CGA 


ACT AGG 


thr 


arg 


thr arg 






151/51 


GGC 


CTC 


CAT CAC 


gly 


leu 


his his 






211/71 


TAT 


CTG 


GGA TC 


tyr 


leu 


gly 



GAC AAG GGC AGC 
asp lys gly ser 

CGC GCC TAG CCT 
arg ala AMB pro 

CTA ATT GTG TGC 
leu ile val cys 



GTC GAT CCC TCG 
val asp pro ser 

GGA CGA GTC CCC 
gly arg val pro 

AAA ACC GTA TCT 
lys thr val ser 



SEQ ID N° 33C 

FIGURE 33C 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



103/185 



PCT/FR98/01813 



sequence Rvl044 predite par Cole et al. 
1/1 

ttg tgt gca aaa ccg tat eta att gat acg 
leu cys ala lys pro tyr leu ile asp thr 
61/21 

gtc gag gtt gec gec gag caa cat ggc tac 
val glu val ala ala glu gin his gly tyr 
121/41 

gtc gac cct gtg cag etc cgc etc eta gcg 
val asp pro val gin leu arg leu leu ala 
181/61 

ggt gtg tac egg gtg ccc gtg ctg ccg cgt 
gly val tyr arg val pro val leu pro arg 
241/81 

teg tgg act ttg ggg cgt ggc gtt ate teg 
ser trp thr leu gly arg gly val ile ser 
301/101 

get gac gtg aac ccg teg cgc ate cat etc 
ala asp val asn pro ser arg ile his leu 
361/121 

gee ggg ggc gag ctg tac cga gtt cac cgc 
ala gly gly glu leu tyr arg val his arg 
421/141 

gtc gac gga ata ccc gtc acg acg gtt gcg 
val asp gly ile pro val thr thr val ala 
481/161 

acg gat cct tat cag ctt egg gec gcg ate 
thr asp pro tyr gin leu arg ala ala ile 
541/181 

cgt ggg tea gca get gag eta cgc get gcg 
arg gly ser ala ala glu leu arg ala ala 
601/201 

egg ccg aag cga gca teg gcg tga 
arg pro lys arg ala ser ala OPA 



(Nature 393:537-544) et contenant seq33A 
31/11 

att gcg cac atg get ate tgg gat cgc etc 
ile ala his met ala ile trp asp arg leu 
91/31 

gtc acg act cgc gat gcg cga gac ate ggc 
val thr thr arg asp ala arg asp ile gly 
151/51 

ggg cgc gga cgt ctt gag cgt gtc ggc cga 
gly arg gly arg leu glu arg val gly arg 
211/71 

ggt gag cac gac gat etc gca gee gca gtg 
gly glu his asp asp leu ala ala ala val 
271/91 

cat gag teg gec ttg gcg ctt cat gee etc 
his glu ser ala leu ala leu his ala leu 
331/111 

ace gtc ccg cgc aac aac cat ccg cgt gcg 
thr val pro arg asn asn his pro arg ala 
391/131 

cgc gac etc cag gca gee cac gtc act teg 
arg asp leu gin ala ala his val thr ser 
451/151 

cgc ace ate aaa gac tgc gtg aag acg ggc 
arg thr ile lys asp cys val lys thr gly 
511/171 

gag cga gec gaa gee gag ggc acg ctt cgt 
glu arg ala glu ala glu gly thr leu arg 
571/191 

etc gat gag ace act gec gga tta cgc get 
leu asp glu thr thr ala gly leu arg ala 



SEQ ID N° 33D 
FIGURE 33D 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



104/185 

ORF d'apres Cole et al. (Nature 393:537-544) et contenant Rvl044 
1/1 31/11 

taa ttg tgt gca aaa ccg tat eta att gat acg att gcg cac atg get ate tgg gat cgc 
OCH leu cys ala lys pro tyr leu ile asp thr ile ala his met ala ile trp asp arg 
61/21 91/31 

etc gtc gag gtt gee gec gag caa cat ggc tac gtc acg act cgc gat gcg cga gac ate 
leu val glu val ala ala glu gin his gly tyr val thr thr arg asp ala arg asp ile 
121/41 151/51 

ggc gtc gac cct gtg cag etc cgc etc eta gcg ggg cgc gga cgt ctt gag cgt gtc ggc 
gly val asp pro val gin leu arg leu leu ala gly arg gly arg leu glu arg val gly 
181/61 211/71 

cga ggt gtg tac egg gtg ccc gtg ctg ccg cgt ggt gag cac gac gat etc gca gee gca 
arg gly val tyr arg val pro val leu pro arg gly glu his asp asp leu ala ala ala 
241/81 271/91 

gtg teg tgg act ttg ggg cgt ggc gtt ate teg cat gag teg gee ttg gcg ctt cat gee 
val ser trp thr leu gly arg gly val ile ser his glu ser ala leu ala leu his ala 
301/101 331/111 

etc get gac gtg aac ccg teg cgc ate cat etc acc gtc ccg cgc aac aac cat ccg cgt 
leu ala asp val asn pro ser arg ile his leu thr val pro arg asn asn his pro arg 
361/121 391/131 

gcg gee ggg ggc gag ctg tac cga gtt cac cgc cgc gac etc cag gca gee cac gtc act 
ala ala gly gly glu leu tyr arg val his arg arg asp leu gin ala ala his val thr 
421/141 451/151 

teg gtc gac gga ata ccc gtc acg acg gtt gcg cgc acc ate aaa gac tgc gtg aag acg 
ser val asp gly ile pro val thr thr val ala arg thr ile lys asp cys val lys thr 
481/161 511/171 

ggc acg gat cct tat cag ctt egg gec gcg ate gag cga gec gaa gee gag ggc acg ctt 
gly thr asp pro tyr gin leu arg ala ala ile glu arg ala glu ala glu gly thr leu 
541/181 . 571/191 

cgt cgt ggg tea gca get gag eta cgc get gcg etc gat gag acc act gec gga tta cgc 
arg arg gly ser ala ala glu leu arg ala ala leu asp glu thr thr ala gly leu arg 
601/201 

get egg ccg aag cga gca teg gcg tga 
ala arg pro lys arg ala ser ala OPA 

SEQ ID N° 33F 
FIGURE 33F 



1/1 

ATC CAA CCT GCT GGG CCT GCG CCT TCG AAT 
ile gin pro ala gly pro ala pro ser asn 
61/21 

ACA ACA CCT GGA ATG GGG ACC TTT TCG GTG 
thr thr pro gly met gly thr phe ser val 
121/41 

CCT CGG TCG AGA CGT ATC GCG GCA GCG TTG 
pro arg ser arg arg ile ala ala ala leu 
181/61 

CGC CGC ATA TTT GCC GCG CTG CCG CGG GCC 
arg arg ile phe ala ala leu pro arg ala 



31/11 

CGA CGG CCA GGC CAC CGC TCG CTG CCG GCA 
arg arg pro gly his arg ser leu pro ala 
91/31 

TTG CTG GTA ACC GGG ACA ACC GGC ACC ACG 
leu leu val thr gly thr thr gly thr thr 
151/51 

GCC CTG TCG TTG CTG ACA ATT ACC GCT GGC 
ala leu ser leu leu thr ile thr ala gly 
211/71 
GGA TC 

gly 



SEQ ID N° 34A 



FEUILLE DE RENlRSS^f (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



105/185 



1/1 

TCC AAC CTG CTG GGC CTG CGC CTT CGA ATC 
ser asn leu leu gly leu arg leu arg ile 
61/21 

CAA CAC CTG GAA TGG GGA CCT TTT CGG TGT 
gin his leu glu trp gly pro phe arg cys 
121/41 

CTC GGT CGA GAC GTA TCG CGG CAG CGT TGG 
leu gly arg asp val ser arg gin arg trp 
181/61 

GCC GCA TAT TTG CCG CGC TGC CGC GGG CCG 
ala ala tyr leu pro arg cys arg gly pro 



31/11 

GAC GGC CAG GCC ACC GCT CGC TGC CGG CAA 
asp gly gin ala thr ala arg cys arg gin 
91/31 

TGC TGG TAA CCG GGA CAA CCG GCA CCA CGC 
cys trp OCH pro gly gin pro ala pro arg 
151/51 

CCC TGT CGT TGC TGA CAA TTA CCG CTG GCC 

pro cys arg cys OPA gin leu pro leu ala 

211/71 

GAT C 

asp 



SEQ ID N° 34B 
FIGURE 34B 



1/1 

GAT CCA ACC TGC TGG GCC TGC GCC TTC GAA 
asp pro thr cys trp ala cys ala phe glu 
61/21 

AAC AAC ACC TGG AAT GGG GAC CTT TTC GGT 
asn asn thr trp asn gly asp leu phe gly 
121/41 

GCC TCG GTC GAG ACG TAT CGC GGC AGC GTT 
ala ser val glu thr tyr arg gly ser val 
181/61 

CCG CCG CAT ATT TGC CGC GCT GCC GCG GGC 
pro pro his ile cys arg ala ala ala gly 



31/11 

TCG ACG GCC AGG CCA CCG CTC GCT GCC GGC 
ser thr ala arg pro pro leu ala ala gly 
91/31 

GTT GCT GGT AAC CGG GAC AAC CGG CAC CAC 
val ala gly asn arg asp asn arg his his 
151/51 

GGC CCT GTC GTT GCT GAC AAT TAC CGC TGG 
gly pro val val ala asp asn tyr arg trp 
211/71 
CGG ATC 
arg ile 



SEQ ID N° 34C 
FIGURE 34C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



106/185 

ORF d'apres Cole et al . (Nature 393:537-544) contennant seq34A 
1/1 31/11 

tag ccg cag ggc cct gcg get agg cgc ggc egg tgc cgt tgg ccg egg egg caa teg atg 
AMB pro gin gly pro ala ala arg arg gly arg cys arg trp pro arg arg gin ser met 
61/21 91/31 

ttg cag cag tta caa cgc caa atg gag tct gag cgc ate gtc gag ttc gat cag etc ggc 
leu gin gin leu gin arg gin met glu ser glu arg ile val glu phe asp gin leu gly 
121/41 151/51 

agg gga gac gtt gcg cag cga egg ate caa cct get ggg cct gcg cct teg aat cga egg 
arg gly asp val ala gin arg arg ile gin pro ala gly pro ala pro ser asn arg arg 
181/61 211/71 

cca ggc cac cgc teg ctg ccg gca aca aca cct gga atg ggg ace ttt teg gtg ttg ctg 
pro gly his arg ser leu pro ala thr thr pro gly met gly thr phe ser val leu leu 
241/81 271/91 

gta ace ggg aca ace ggc ace acg cct egg teg aga cgt ate gcg gca gcg ttg gee ctg 
val thr gly thr thr gly thr thr pro arg ser arg arg ile ala ala ala leu ala leu 
301/101 331/111 

teg ttg ctg aca att ace get ggc cgc cgc ata ttt gee gcg ctg ccg egg gee gga tec 
ser, leu leu thr ile thr ala gly arg arg ile phe ala ala leu pro arg ala gly ser 
361/121 391/131 

agg teg ace tgc cag ate tea ccg cgc age ate tac gee gtt cgc tgc aaa ccg ccg act 
arg ser thr cys gin ile ser pro arg ser ile tyr ala val arg cys lys pro pro thr 
421/141 451/151 

gcg acg gca ggc cca etc tct tgg cat gcg tec aat get gcg acg tec teg gta gac aag 

ala thr ala gly pro leu ser trp his ala ser asn ala ala thr ser ser val asp lys 

481/161 511/171 

etc acg ctt ggc ttc atg ccg cag tec tac cca tgt agt aac aga tag 

leu thr leu gly phe met pro gin ser tyr pro cys ser asn arg AMB 



SEQ ID N° 34F 
FIGURE 34F 



1/1 

CAG TCT GTC GGC AAG GAG GGA CGC ATG CCA 
gin ser val gly lys glu gly arg met pro 
61/21 

CAG ATC GAG AGC GCT CTC TAC GCC GAA GAT 
gin ile glu ser ala leu tyr ala glu asp 
121/41 

GGC TTC CGC GCA CCG ACC GCG CGG CGG CGC 
gly phe arg ala pro thr ala arg arg arg 
181/61 

CTG GGG ATG TTG GTT TCC GGC GTG GCG TTC 
leu gly met leu val ser gly val ala phe 
241/81 

CTC AGC GTT TTC GGT TTT GTC GTG ATG TTC 
leu ser val phe gly phe val val met phe 
301/101 

CGG TTG TCC GGC AGG ATG GAT CGT GGC GGA 
arg leu ser gly arg met asp arg gly gly 
361/121 

ACC AAG GGG GCC GGG GGC TCA TTC ACC AGC 
thr lys gly ala gly gly ser phe thr ser 



31/11 

CTC TCC GAT CAT GAG CAG CGG ATG CTT GAC 
leu ser asp his glu gin arg met leu asp 
91/31 

CCC AAG TTC GCA TCG AGT GTC CGT GGC GGG 
pro lys phe ala ser ser val arg gly gly 
151/51 

CTG CAG GGC GCG GCG TTG TTC ATC ATC GGT 
leu gin gly ala ala leu phe ile ile gly 
211/71 

AAA GAG ACC ATG ATC GGA AGT TTC CCG ATA 
lys giu thr met ile gly ser phe pro ile 
271/91 

GGT GGT GTG GTG TAT GCC ATC ACC GGT CCT 
gly gly val val tyr ala ile thr gly pro 
331/111 

TCG GCT GCT GGG GCT TCG CGC CAG CGT CGT 
ser ala ala gly ala ser arg gin arg arg 
391/131 

CGT ATG GAA GAT C 
arg met glu asp 



SEQ ID N° 35A 
FEUILLE DE REI^^^|^(REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



107/185 



1/1 

GAC AGT CTG TCG GCA AGG AGG 
asp ser leu ser ala arg arg 
61/21 

ACC AGA TCG AGA GCG CTC TCT 
thr arg ser arg ala leu ser 
121/41 

GGG GCT TCC GCG CAC CGA CCG 
gly ala ser ala his arg pro 
181/61 

GTC TGG GGA TGT TGG TTT CCG 
val trp gly cys trp phe pro 
241/81 

TAC TCA GCG TTT TCG GTT TTG 
tyr ser ala phe ser val leu 
301/101 

CTC GGT TGT CCG GCA GGA TGG 
leu gly cys pro ala gly trp 
361/121 

GTA CCA AGG GGG CCG GGG GCT 
val pro arg gly pro gly ala 



31/11 



GAC 


GCA 


TGC 


CAC TCT 


CCG 


asp 


ala 


cys 


his ser 


pro 








91/31 




ACG 


CCG 


AAG 


ATC CCA 


AGT 


thr 


pro 


lys 


ile pro 


ser 








151/51 




CGC 


GGC 


GGC 


GCC TGC 


AGG 


arg gly 


gly ala cys 


arg 








211/71 




GCG 


TGG 


CGT 


TCA AAG 


AGA 


ala 


trp 


arg 


ser lys 


arg 








271/91 




TCG 


TGA 


TGT 


TCG GTG 


GTG 


ser 


CPA 


cys 


ser val 


val 








331/111 




ATC 


GTG 


GCG 


GAT CGG 


CTG 


ile 


val 


ala 


asp arg 


leu 








391/131 




CAT 


TCA 


CCA 


GCC GTA 


TGG 


his 


ser 


pro 


ala val 


trp 



SEQ ID N° 35B 
FIGURE 35B 



ATC ATG AGC AGC GGA TGC TTG 
ile met ser ser gly cys leu 

TCG CAT CGA GTG TCC GTG GCG 
ser his arg val ser val ala 

GCG CGG CGT TGT TCA TCA TCG 
ala arg arg cys ser ser ser 

CCA TGA TCG GAA GTT TCC CGA 
pro OPA ser glu val ser arg 

TGG TGT ATG CCA TCA CCG GTC 
trp cys met pro ser pro val 

CTG GGG CTT CGC GCC AGC GTC 
leu gly leu arg ala ser val 

AAG ATC 
lys ile 



1/1 

ACA GTC TGT CGG CAA 
thr val cys arg gin 
61/21 

CCA GAT CGA GAG CGC 
pro asp arg glu arg 
121/41 

GGG CTT CCG CGC ACC 
gly leu pro arg thr 
181/61 

TCT GGG GAT GTT GGT 
ser gly asp val gly 
241/81 

ACT CAG CGT TTT CGG 
thr gin arg phe arg 
301/101 

TCG GTT GTC CGG CAG 
ser val val arg gin 
361/121 

TAC CAA GGG GGC CGG 
tyr gin gly giy arg 



GGA 


GGG 


ACG 


CAT 


GCC 


gly gly thr 


his 


ala 


TCT 


CTA 


CGC 


CGA 


AGA 


ser 


leu 


arg 


arg 


arg 


GAC 


CGC 


GCG 


GCG 


GCG 


asp 


arg 


ala 


ala 


ala 


TTC 


CGG 


CGT 


GGC 


GTT 


phe 


arg 


arg gly 


val 


TTT 


TGT 


CGT 


GAT 


GTT 


phe 


cys 


arg 


asp 


val 


GAT 


GGA 


TCG 


TGG 


CGG 


asp gly 


ser 


trp 


arg 


GGG 


CTC 


ATT 


CAC 


CAG 


gly 


leu 


ile 


his 


gin 



31/11 

ACT CTC CGA TCA TGA 
thr leu arg ser OPA 
91/31 

TCC CAA GTT CGC ATC 
ser gin val arg ile 
151/51 

CCT GCA GGG CGC GGC 
pro ala gly arg gly 
211/71 

CAA AGA GAC CAT GAT 
gin arg asp his asp 
271/91 

CGG TGG TGT GGT GTA 
arg trp cys gly val 
331/111 

ATC GGC TGC TGG GGC 
ile gly cys trp gly 
391/131 

CCG TAT GGA AGA TC 
pro tyr gly arg 



GCA GCG GAT GCT TGA 
ala ala asp ala OPA 

GAG TGT CCG TGG CGG 

glu cys pro trp arg / 

GTT GTT CAT CAT CGG 
val val his his arg 

CGG AAG TTT CCC GAT 
arg lys phe pro asp 

TGC CAT CAC CGG TCC 
cys his his arg ser 

TTC GCG CCA GCG TCG 
phe ala pro ala ser 



SEQ ID N° 35C 



FEU1LLE DE REwiKS^fliff (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



108/185 



sequence Rv2169c predite par Cole et al. (Nature 393:537-544) et contenant 
partiellement seq35A 



1/1 

1/ 1 


















Ji/ 1 1 


















atg cca 


etc 


tec 


gat 


cat 


gag 


cag 


egg 


atg 


ctt gac 


cag 


ate 


gag 


age 


get 


etc 


tac 


gec 


Met pro 


leu 


ser 


asp 


his 


glu 


gin arg 


met 


leu asp 


gin 


ile 


glu 


ser 


ala 


leu 


tyr 


ala 


Dl/21 


















qi / 'a i 
y 1/ j l 


















gaa gat 


ccc 


aag 


ttc 


gca 


teg 


agt 


gtc 


cgt 


ggc ggg 


ggc 


ttc 


cgc 


gca 


ccg 


acc 


gcg 


egg 


glu asp 


pro 


lys 


phe 


ala 


ser 


ser 


val 


arg 


gly gly 


gly phe 


arg 


ala 


pro 


thr 


ala 


arg 


1 O 1 / A 1 

121/41 


















101/ J 1 


















egg cgc 


ctg 


cag 


ggc 


gcg 


gcg 


ttg 


ttc 


acc 


ate ggt 


ctg 


ggg 


atg 


ttg 


gtt 


tec 


ggc 


gtg 


arg arg 


leu gin 


gly ala 


ala 


leu phe 


lie 


lie giy 


leu 


gly met 


leu 


val 


ser 


gly val 


181/ oi 


















911 /71 


















gcg ttc 


aaa 


gag 


acc 


atg 


ate 


gga 


agt 




ccg ata 


etc 


age 


gtt 


cue 


ggt 


ttt 


gtc 


gtg 


ala phe 


lys 


glu 


thr 


met 


ile 


gly 


ser 


phe 


pro ile 


leu 


ser 


val 


phe 


gly phe 


val 


val 


241/81 


















271/91 


















atg ttc 


ggt 


ggt 


gtg 


gtg 


tat 


gec 


ate 


acc 


ggt cct 


egg 


ttg 


tec 


ggc 


agg 


atg 


gat 


cgt 


met phe 


gly gly 


val 


val 


tyr 


ala 


ile 


thr 


gly pro 


arg 


leu 


ser 


giy 


arg 


met 


asp 


arg 


301/101 


















331/111 


















ggc gga 


teg 


get 


get 


ggg 


get 


teg 


cgc 


cag 


cgt cgt 


acc 


aag 


ggg 


gee 


ggg 


ggc 


tea 


ttc 


gly gly 


ser 


ala 


ala gly ala 


ser 


arg 


gin 


arg arg 


thr 


lys 


gly 


ala 


gly gly 


ser 


phe 


361/121 


















391/131 


















acc age 


cgt 


atg 


gaa 


gat 


egg 


ttc 


egg 


cgc 


cgc ttc 


gac 


gag 


taa 












thr ser 


arg 


met 


glu 


asp 


arg 


phe 


arg 


arg 


arg phe 


asp glu OCH 













SEQ ID N° 35D 



FIGURE 35D 



ORF d'apres Cole et al. (Nature 393:537-544) et contennant Rv2169c 
1/1 31/11 

tga cag tct gtc ggc aag gag gga cgc atg cca etc tec gat cat gag cag egg atg ctt 
OPA gin ser val gly lys glu gly arg met pro leu ser asp his glu gin arg met leu 
61/21 91/31 

gac cag ate gag age get etc tac gec gaa gat ccc aag ttc gca teg agt gtc cgt ggc 
asp gin ile glu ser ala leu tyr ala glu asp pro lys phe ala ser ser val arg gly 
121/41 151/51 

ggg ggc ttc cgc gca ccg acc gcg egg egg cgc ctg cag ggc gcg gcg ttg ttc ate ate 
gly gly phe arg ala pro thr ala arg arg arg leu gin gly ala ala leu phe ile ile 
181/61 211/71 

ggt ctg ggg atg ttg gtt tec ggc gtg gcg ttc aaa gag acc atg ate gga agt ttc ccg 
gly leu gly met leu val ser gly val ala phe lys glu thr met ile gly ser phe pro 
241/81 271/91 

ata etc age gtt ttc ggt ttt gtc gtg atg ttc ggt ggt gtg gtg tat gec ate acc ggt 
ile leu ser val phe gly phe val val met phe gly gly val val tyr ala ile thr gly 
301/101 331/111 

cct egg ttg tec ggc agg atg gat cgt ggc gga teg get get ggg get teg cgc cag cgt 
pro arg leu ser gly arg met asp arg gly gly ser ala ala gly ala ser arg gin arg 
361/121 391/131 

cgt acc aag ggg gee ggg ggc tea ttc acc age cgt atg gaa gat egg ttc egg cgc cgc 
arg thr lys gly ala gly gly ser phe thr ser arg met glu asp arg phe arg arg arg 
421/141 

ttc gac gag taa 
phe asp glu OCH 

SEQ ID 35F 



FEUILLE DE REW^^^|,(REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



109/185 



1/1 

GAC CTG GGA CGA AGA CGA CGG 
asp leu gly arg arg arg arg 
61/21 

CAA TGG ACA CCC GAC TAC GGT 
gin trp thr pro asp tyr gly 
121/41 

GTG GTC GGA GTG CCA CCC GAC 
val val gly val pro pro asp 
181/61 

ACG GCG CCG GTC TGG ATC ACC 
thr ala pro val trp ile thr 
241/81 

GGG GCA CCC GGT GGC ACC GTT 
gly ala pro gly gly thr val 
301/101 

GCC AAC GGC GGC CGG CTG GAC 
ala asn gly gly arg leu asp 
361/121 

GTC GAC CCC GAC GGC GCC GTC 
val asp pro asp gly ala val 









JX/ 11 




CAG 


CAG 


CCG 






gin gin pro 


gin ser 


asp 








31/ Ji 




GCG 


CCT 


GCG 




PB.P 


ala 


pro 


ala 


arg leu 


asp 








1 SI /M 
XDx/ Dx 




CAG 


GCC 


ACC 


wVL. lit 




gin ala thr 


asp phe 


gly 








911 /*71 
£. XXI fx 




ATG 


CTG 


TGG 






met 


leu 


trp 


n KA 1 an 


did 








271/91 




CCC 


GTC 


CGG 


CTG GTC 


GAC 


pro 


val 


arg 


leu val 


asp 








331/111 




ATC 


CTC 


CTG 


TCG GCG 


GCC 


ile 


leu 


leu 


ser ala 


ala 








391/131 




GGC 


CGA 


GCG 


CTG TGC 


CTG 


gly arg 


ala 


leu cys 


leu 



SEQ ID N° 36A 
FIGURE 36A 



CTA CCC GGT CCT GGT CAA CGT 
leu pro gly pro gly gin arg 

AAT GCG CGG TTC CTG TTG CCC 
asn ala arg phe leu leu pro 

TCC GCT GTT GCA CCA GAA ACG 
ser ala val ala pro glu thr 

GAC CGG CCC CGG TTG GCC CCC 
asp arg pro arg leu ala pro 

GAC GAC CTG GCA AAC TCG CTG 
asp asp leu ala asn ser leu 

GAG TTC GCC ACC AAC CGG GAA 
glu phe ala thr asn arg glu 

GCC ATC GAC CCA GAT C 
ala ile asp pro asp 



1/1 

ACC TGG GAC GAA GAC GAC GGC AGC AGC CGC 
thr trp asp glu asp asp gly ser ser arg 
61/21 

AAT GGA CAC CCG ACT ACG GTG CGC CTG CGC 
asn gly his pro thr thr val arg leu arg 
121/41 

TGG TCG GAG TGC CAC CCG ACC AGG CCA CCG 
trp ser glu cys his pro thr arg pro pro 
181/61 

CGG CGC CGG TCT GGA TCA CCA TGC TGT GGC 
arg arg arg ser gly ser pro cys cys gly 
241/81 

GGG CAC CCG GTG GCA CCG TTC CCG TCC GGC 
gly his pro val ala pro phe pro ser gly 
301/101 

CCA ACG GCG GCC GGC TGG ACA TCC TCC TGT 
pro thr ala ala gly trp thr ser ser cys 
361/121 

TCG ACC CCG ACG GCG CCG TCG GCC GAG CGC 
ser thr pro thr ala pro ser ala glu arg 



31/11 

AAT CAG ATC TAC CCG GTC CTG GTC AAC GTC 
asn gin ile tyr pro val leu val asn val 
91/31 

GGC TCG ACA ATG CGC GGT TCC TGT TGC CCG 
gly ser thr met arg gly ser cys cys pro 
151/51 

ACT TCG GCT CCG CTG TTG CAC CAG AAA CGA 
thr ser ala pro leu leu his gin lys arg 
211/71 

CGC TGG CCG ACC GGC CCC GGT TGG CCC CCG 
arg trp pro thr gly pro gly trp pro pro 
271/91 

TGG TCG ACG ACG ACC TGG CAA ACT CGC TGG 
trp ser thr thr thr trp gin thr arg trp 
331/111 

CGG CGG CCG AGT TCG CCA CCA ACC GGG AAG 
arg arg pro ser ser pro pro thr gly lys 
391/131 

TGT GCC TGG CCA TCG ACC CAG ATC 
cys ala trp pro ser thr gin ile 



SEQ ID N° 36B 



FEUILLE DE REM^£ifa^P(REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



110/185 



1 / 1 

1/ 1 


















O 1 / 1 1 






















imp 


AL.b 




bOrt 


GCA 


GCC 


cp a 


atp apa 


TPT 
i b 1 


npp 
ACL 


bbb 


1 LL 


I bb 


IbA 


Abb 


ICA 


pro yiy 








t-h r 


ala 


ala 


ala 


a! a 
ax a 


lie d L y 


ser 


L.X1 L 


arg 


ser 


crp 


ser 


thr 


ser 


£1 /O 1 


















j 1 / j 1 


















Rfpr PAT 






PTtt 


pp. p. 


TCP 


GCC 


TGC 


P.PP. 


rpf ppa 
bb 1 bbr\ 


paa 


TPP 
1 


ppp 




bbl 


GTT 


GCC 


bbl 


me t asp 




a r g 


icu 


a rn 

d x. y 




ala 


cys 


Ala 
aid 


ala a rg 


gin 


cys 


A 1 A 


wa 1 

va i 


pro 


val 


ala 


arg 


1*3 1 /d 1 


















101/ 01 




















Abl 


ppp 


&pp 

ALL 


PfTfi 
bb/\ 


ppa 


GGC 


CAC 




PTT PPP 
Oil Luu 


Lib 


bbb 


1 bi 


lbb 




AGA 


AAC 


GAC 


gly arg 


ser 


aid 


fhr 


arg 


pro 


gly his 


a rg 


leu arg 


leu 


a rg 


cys 


cys 


thr 


arg 


asn 


asp 


lol/ol 


















/ 1 1/ / I 


















fpp rpp 


bo 1 


PTC 


onl 


CAC 


CAT 


GCT 


GTG 




rpT p.pp 
otl ij^L 


ppa 


ppp 


ppp 

bbb 


ppp 


GTT 


GGC 


CCC 


bbb 


gly ala 


gxy 


1 on 




his 


his 


ala 


val 


a! a 
did 


A 1 A rrl 
axa y x y 


arg 


pro 


A 1 A 

ala 


pro 


val 


gly pro 


arg 


241/81 


















271/91 


















GGC ACC 


CGG 


TGG 


CAC 


CGT 


TCC 


CGT 


CCG 


GCT 


GGT CGA 


CGA 


CGA 


CCT 


GGC 


AAA 


CTC 


GCT 


GGC 


gly thr 


arg 


trp 


his 


arg 


ser 


arg 


pro 


ala 


gly arg 


arg 


arg 


pro 


gly 


lys 


leu 


ala 


gly 


301/101 


















331/111 


















CAA CGG 


CGG 


CCG 


GCT 


GGA 


CAT 


CCT 


CCT 


GTC 


GGC GGC 


CGA 


GTT 


CGC 


CAC 


CAA 


CCG 


GGA 


AGT 


gin arg 


arg 


pro 


ala 


gly his 


pro 


pro 


val 


gly gly 


arg 


val 


arg 


his 


gin pro 


gly 


ser 


361/121 


















391/131 


















CGA CCC 


CGA 


CGG 


CGC 


CGT 


CGG 


CCG 


AGC 


GCT 


GTG CCT 


GGC 


CAT 


CGA 


CCC 


AGA 


TC 






arg pro 


arg 


arg 


arg 


arg 


arg 


pro 


ser 


ala 


val pro 


gly 


his 


arg 


pro 


arg 









SEQ ID N° 36 C 
FIGURE 36C 



Sequence codante Rv3909 predite par Cole et al., 1998 (Nature 393 537-544) 
contenant Seq 36A 



1/1 


















31/11 


















GTG ACC 


GCA 


CTG 


CAA 


CTC 


GGC 


TGG 


GCC 


GCT 


TTG GCG 


CGC 


GTC 


ACC 


TCA 


GCG 


ATC 


GGC 


GTC 


met thr 


ala 


leu 


gin 


leu 


gly 


trp 


ala 


ala 


leu ala 


arg 


val 


thr 


ser 


ala 


ile 


gly 


val 


61/21 


















91/31 


















GTG GCC 


GGC 


CTC 


GGG 


ATG 


GCG 


CTC 


ACG 


GTA 


CCG TCG 


GCG 


GCA 


CCG 


CAC 


GCG 


CTC 


GCA 


GGC 


val ala 


gly 


leu 


gly 


met 


ala 


leu 


thr 


val 


pro ser 


ala 


ala 


pro 


his 


ala 


leu 


ala 


gly 


121/41 


















151/51 


















GAG CCC 


AGC 


CCG 


ACG 


CCT 


TTT 


GTC 


CAG 


GTC 


CGC ATC 


GAT 


CAG 


GTG 


ACC 


CCG 


GAC 


GTG 


GTG 


glu pro 


ser 


pro 


thr 


pro 


phe 


val 


gin 


val 


arg ile 


asp 


gin 


val 


thr 


pro 


asp 


val 


val 


181/61 


















211/71 


















ACC ACT 


TCC 


AGC 


GAA 


CCC 


CAT 


GTC 


ACC 


GTC 


AGC GGA 


ACG 


GTG 


ACC 


AAT 


ACC 


GGT 


GAC 


CGC 


thr thr 


ser 


ser 


glu 


pro 


his 


val 


thr 


val 


ser gly 


thr 


val 


thr 


asn 


thr 


gly 


asp 


arg 


241/81 


















271/91 


















CCA GTC 


CGC 


GAT 


GTG 


ATG 


GTC 


CGG 


CTT 


GAG 


CAC GCC 


GCC 


GCG 


GTC 


ACG 


TCG 


TCA 


ACG 


GCG 


pro val 


arg 


asp 


val 


met 


val 


arg 


leu 


glu 


his ala 


ala 


ala 


val 


thr 


ser 


ser 


thr 


ala 


301/101 


















331/111 


















TTA CGC 


ACC 


TCG 


CTC 


GAC 


GGC 


GGC 


ACC 


GAC 


CAG TAC 


CAG 


CCG 


GCC 


GCG 


GAC 


TTC 


CTC 


ACG 


leu arg 


thr 


ser 


leu 


asp 


gly 


gly 


thr 


asp 


gin tyr 


gin 


pro 


ala 


ala 


asp phe 


leu 


thr 



SEQ ID N° 36D 



FIGURE 36D 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



111/185 



361/121 

GTC GCC CCC GAA CTA GAC CGC GGG CAA GAG 
val ala pro glu leu asp arg gly gin glu 
421/141 

TCG CTG ACC AGG CCG TCG TTG GCC GTC AAC 
ser leu thr arg pro ser leu ala val asn 
481/161 

GTC AAT GGG ACA CCC GAC TAC GGT GCG CCT 
val asn gly thr pro asp tyr gly ala pro 
541/181 

CCC GTG GTC GGA GTG CCA CCC GAC CAG GCC 
pro val val gly val pro pro asp gin ala 
601/201 

ACG ACG GCG CCG GTC TGG ATC ACC ATG CTG 
thr thr ala pro val trp ile thr met leu 
661/221 

CCC GGG GCA CCC GGT GGC ACC GTT CCC GTC 
pro gly ala pro gly gly thr val pro val 
721/241 

CTG GCC AAC GGC GGC CGG CTG GAC ATC CTC 
leu ala asn gly gly arg leu asp ile leu 
781/261 

GAA GTC GAC CCC GAC GGC GCC GTC GGC CGA 
glu val asp pro asp gly ala val gly arg 
841/281 

CTC ATC ACC GTC AAT GCG ATG ACC GGC GGC 
leu ile thr val asn ala met thr gly gly 
901/301 

GCT CAA CTA CCG GGC ACC CCG ACC CAC CCG 
ala gin leu pro gly thr pro thr his pro 
961/321 

CTG GAT CGA TTG CGG ACG CTA GTC CAC CGG 
leu asp arg leu arg thr leu val his arg 
1021/341 

GCC GAC CTG GAT GCT TTG CAG CGG GTT AAT 
ala asp leu asp ala leu gin arg val asn 
1081/361 

AGC CCC GCC GAC ATC GTC GAC CGC ATC CTG 
ser pro ala asp ile val asp arg ile leu 
1141/381 

CTG CCC GAC GGC CCG TTG ACC GGC CGG GCG 
leu pro asp gly pro leu thr gly arg ala 
1201/401 

GTT GCC GTC GCG GCC GCC GAT TTT AGC CCC 
val ala val ala ala ala asp phe ser pro 
1261/421 

TCC GCG CTC TTA CCC GCT ACC GCG CCC CGG 
ser ala leu leu pro ala thr ala pro arg 
1321/441 

TTT GAT CCC GCG GTC GGG GCC GCG CTG GCC 
phe asp pro ala val gly ala ala leu ala 
1381/461 

TAT CTA GAT CCC TCG TTG TTC GTT CGG ATC 
tyr leu asp pro ser leu phe val arg ile 



391/131 

GCC GGC TTT ACC CTC TCG GCC CCG CTG CGC 
ala gly phe thr leu ser ala pro leu arg 
451/151 

CAG CCC GGG ATC TAC CCG GTC CTG GTC AAC 
gin pro gly ile tyr pro val leu val asn 
511/171 

GCG CGG CTC GAC AAT GCG CGG TTC CTG TTG 
ala arg leu asp asn ala arg phe leu leu 
571/191 

ACC GAC TTC GGC TCC GCT GTT GCA CCA GAA 
thr asp phe gly ser ala val ala pro glu 
631/211 

TGG CCG CTG GCC GAC CGG CCC CGG TTG GCC 
trp pro leu ala asp arg pro arg leu ala 
691/231 

CGG CTG GTC GAC GAC GAC CTG GCA AAC TCG 
arg leu val asp asp asp leu ala asn ser 
751/251 

CTG TCG GCG GCC GAG TTC GCC ACC AAC CGG 
leu ser ala ala glu phe ala thr asn arg 
811/271 

GCG CTG TGC CTG GCC ATC GAC CCA GAT CTA 
ala leu cys leu ala ile asp pro asp leu 
871/291 

TAC GTC GTG TCC GAC TCG CCC GAC GGG GCC 
tyr val val ser asp ser pro asp gly ala 
931/311 

GGC ACC GGC CAG GCC GCC GCA TCC AGC TGG 
gly thr gly gin ala ala ala ser ser trp 
991/331 

ACA TGC GTG ACG CCG CTG CCT TTT GCC CAA 
thr cys val thr pro leu pro phe ala gin 
1051/351 

GAT CCG AGG CTG AGC GCG ATC GCA ACC ATC 
asp pro arg leu ser ala ile ala thr ile 
1111/371 

GAT GTC AGC TCC ACC CGC GGC GCA ACC GTG 
asp val ser ser thr arg gly ala thr val 
1171/391 

ATC AAC TTG CTC AGC ACC CAC GGC AAC ACG 
ile asn leu leu ser thr his gly asn thr 
1231/411 

GAG GAA CAG CAG GGT TCG TCC CAG ATC GGC 
glu glu gin gin gly ser ser gin ile gly 
1291/431 

CGG TTG TCC CCG CGG GTG GTA GCG GCG CCG 
arg leu ser pro arg val val ala ala pro 
1351/451 

GCC GCG GGA ACA AAC CCG ACC GTT CCT ACC 
ala ala gly thr asn pro thr val pro thr 
1411/471 

GCG CAT GAA TCG ATC ACC GCG CGC CGC CAG 
ala his glu ser ile thr ala arg arg gin 



SEQ ID N° 36D (suite 1) 



FEUILLE D^f?^LA©fcMfaW (REGIlE 26) 



WO 99/09186 



PCT/FR98/01813 



112/185 



1441/481 

GAC GCC TTG GGC GCA ATG CTG TGG CGC AGC 
asp ala leu gly ala met leu trp arg ser 
1501/501 

ATC CTG GTG CCG CCG GCG TCG TGG AGC CTG 
ile leu val pro pro ala ser trp ser leu 
1561/521 

GCG CTG GCC ACC GCC ATC CGG TCT GGC CTG 
ala leu ala thr ala ile arg ser gly leu 
1621/541 

GCT GAC GCC GCG GCC CGC ACC GAG CCA CCG 
ala asp ala ala ala arg thr glu pro pro 
1681/561 

GGC CGG TTC AAT GAC GAC ATC ACC ACG CAG 
gly arg phe asn asp asp ile thr thr gin 
1741/581 

CTG ACC TCG GCG TTG ACC ATC GAT GAC CGC 
leu thr ser ala leu thr ile asp asp arg 
1801/601 

CCA CTA CGC GAG GAC ATG TTG CGC GCG CTG 
pro leu arg glu asp met leu arg ala leu 
1861/621 

GGG CTG GCC CAG CAG CGG CTG GCC GTC GTT 
gly leu ala gin gin arg leu ala val val 
1921/641 

GTG ACC ATC GTC AAC CCG GGC GGC TCC TAC 
val thr ile val asn pro gly gly ser tyr 
1981/661 

TTG GCG CTG CAT AAT GGC CTC GCC GTG CCA 
leu ala leu his asn gly leu ala val pro 
2041/681 

CCC GGG ATG ACG GTG GCC GAT GTC GGT CAG 
pro gly met thr val ala asp val gly gin 
2101/701 

CGA GTA CCA ATC GAG GTG AAC TTC ACA CAG 
arg val pro ile glu val asn phe thr gin 
2161/721 

CCC GAC GGC GTC GCG CTG GGT GAA CCG GTG 
pro asp gly val ala leu gly glu pro val 
2221/741 

AAG GTG TTG TTC GCG ATC ACG CTA TCC GCT 
lys val leu phe ala ile thr leu ser ala 
2281/761 

CGC CTT TGG CAC CGG TTC CGT GGC CAG CCT 
arg leu trp his arg phe arg gly gin pro 
2341/781 

CCT ACC GGC AAA CAC GCC CCG CAG CGC CGT 
pro thr gly lys his ala pro gin arg arg 
2401/801 
CGG GTA TGA 
arg val OPA 



1471/491 

TTG GAG CCG AAT GCC GCG CCC CGT ACC CAA 
leu glu pro asn ala ala pro arg thr gin 
1531/511 

GCC AGC GAC GAC GCG CAG GTC ATC CTG ACC 
ala ser asp asp ala gin val ile leu thr 
1591/531 

GCC GTG CCG CGA CCA CTA CCG GCG GTG ATC 
ala val pro arg pro leu pro ala val ile 
1651/551 

GAA CCC CCG GGC GCT TAC AGC GCC GCT CGC 
glu pro pro gly ala tyr ser ala ala arg 
1711/571 

ATC GGC GGG CAG GTT GCC CGG CTA TGG AAG 
ile gly gly gin val ala arg leu trp lys 
1771/591 

ACC GGG CTG ACC GGC GTG CAG TAC ACC GCA 
thr gly leu thr gly val gin tyr thr ala 
1831/611 

AGC CAA TCG CTA CCA CCC GAT ACC CGC AAC 
ser gin ser leu pro pro asp thr arg asn 
1891/631 

GGA AAG ACG ATC GAC GAT CTT TTC GGC GCG 
gly lys thr ile asp asp leu phe gly ala 
1951/651 

ACT CTG GCC ACC GAG CAC AGT CCG CTG CCG 
thr leu ala thr glu his ser pro leu pro 
2011/671 

ATC CGG GTC CGG CTA CAG GTC GAT GCT CCG 
ile arg val arg leu gin val asp ala pro 
2071/691 

ATC GAG CTA CCG CCC GGG TAC CTG CCG CTA 
ile glu leu pro pro gly tyr leu pro leu 
2131/711 

CGG GTT GCC GTC GAC GTG TCG CTG CGG ACC 
arg val ala val asp val ser leu arg thr 
2191/731 

CGG TTG TCG GTG CAC TCC AAC GCC TAC GGC 
arg leu ser val his ser asn ala tyr gly 
2251/751 

GCG GCC GTG CTG GTA ACG CTG GCG GGC CGG 
ala ala val leu val thr leu ala gly arg 
2311/771 

GAT CGC GCC GAC CTG GAT CGC CCC GAC CTG 
asp arg ala asp leu asp arg pro asp leu 
2371/791 

GCC GTA GCC AGT CGG GAT GAC GAA AAG CAC 
ala val ala ser arg asp asp glu lys his 



SEQ ID N° 36D (suite 2) 

FIGURE 36D (suite 2) 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



113/185 



ORF d'apres Cole et al., 1998 (Nature 393 537-544) et contenant Rv 3909. 
1/1 31/11 

TGA CTC AGC ACC GGG TCA GCA CAA CGG TCC CGG GCC GGG GCC GTG ACC GCA CTG CAA CTC 
OPA leu ser thr gly ser ala gin arg ser arg ala gly ala val thr ala leu gin leu 
61/21 91/31 

GGC TGG GCC GCT TTG GCG CGC GTC ACC TCA GCG ATC GGC GTC GTG GCC GGC CTC GGG ATG 
gly trp ala ala leu ala arg val thr ser ala ile gly val val ala gly leu gly met 
121/41 151/51 

GCG CTC ACG GTA CCG TCG GCG GCA CCG CAC GCG CTC GCA GGC GAG CCC AGC CCG ACG CCT 
ala leu thr val pro ser ala ala pro his ala leu ala gly glu pro ser pro thr pro 
181/61 211/71 

TTT GTC CAG GTC CGC ATC GAT CAG GTG ACC CCG GAC GTG GTG ACC ACT TCC AGC GAA CCC 
phe val gin val arg ile asp gin val thr pro asp val val thr thr ser ser glu pro 
241/81 271/91 

CAT GTC ACC GTC AGC GGA ACG GTG ACC AAT ACC GGT GAC CGC CCA GTC CGC GAT GTG ATG 
his val thr val ser gly thr val thr asn thr gly asp arg pro val arg asp val met 
301/101 331/111 

GTC CGG CTT GAG CAC GCC GCC GCG GTC ACG TCG TCA ACG GCG TTA CGC ACC TCG CTC GAC 
val arg leu glu his ala ala ala val thr ser ser thr ala leu arg thr ser leu asp 
361/121 391/131 

GGC GGC ACC GAC CAG TAC CAG CCG GCC GCG GAC TTC CTC ACG GTC GCC CCC GAA CTA GAC 
gly gly thr asp gin tyr gin pro ala ala asp phe leu thr val ala pro glu leu asp 
421/141 451/151 

CGC GGG CAA GAG GCC GGC TTT ACC CTC TCG GCC CCG CTG CGC TCG CTG ACC AGG CCG TCG 
arg gly gin glu ala gly phe thr leu ser ala pro leu arg ser leu thr arg pro ser 
481/161 511/171 

TTG GCC GTC AAC CAG CCC GGG ATC TAC CCG GTC CTG GTC AAC GTC AAT GGG ACA CCC GAC 
leu ala val asn gin pro gly ile tyr pro val leu val asn val asn gly thr pro aso 
541/181 571/191 

TAC GGT GCG CCT GCG CGG CTC GAC AAT GCG CGG TTC CTG TTG CCC GTG GTC GGA GTG CCA 
tyr gly ala pro ala arg leu asp asn ala arg phe leu leu pro val val gly val pro 
601/201 631/211 

CCC GAC CAG GCC ACC GAC TTC GGC TCC GCT GTT GCA CCA GAA ACG ACG GCG CCG GTC TGG 
pro asp gin ala thr asp phe gly ser ala val ala pro glu thr thr ala pro val trp 
661/221 691/231 

ATC ACC ATG CTG TGG CCG CTG GCC GAC CGG CCC CGG TTG GCC CCC GGG GCA CCC GGT GGC 
ile thr met leu trp pro leu ala asp arg pro arg leu ala pro gly ala pro gly gly 
721/241 751/251 

ACC GTT CCC GTC CGG CTG GTC GAC GAC GAC CTG GCA AAC TCG CTG GCC AAC GGC GGC CGG 
thr val pro val arg leu val asp asp asp leu ala asn ser leu ala asn gly gly arg 
781/261 811/271 

CTG GAC ATC CTC CTG TCG GCG GCC GAG TTC GCC ACC AAC CGG GAA GTC GAC CCC GAC GGC 
leu asp ile leu leu ser ala ala glu phe ala thr asn arg glu val asp pro asp gly 
841/281 871/291 

GCC GTC GGC CGA GCG CTG TGC CTG GCC ATC GAC CCA GAT CTA CTC ATC ACC GTC AAT GCG 
ala val gly arg ala leu cys leu ala ile asp pro asp leu leu ile thr val asn ala 
901/301 931/311 

ATG ACC GGC GGC TAC GTC GTG TCC GAC TCG CCC GAC GGG GCC GCT CAA CTA CCG GGC ACC 
met thr gly gly tyr val val ser asp ser pro asp gly ala ala gin leu pro gly thr 
961/321 991/331 

CCG ACC CAC CCG GGC ACC GGC CAG GCC GCC GCA TCC AGC TGG CTG GAT CGA TTG CGG ACG 
pro thr his pro gly thr gly gin ala ala ala ser ser trp leu asp arg leu arg thr 



SEQ ID N° 36F 



FEUILLE DE REIMPL«RZ^AB«F(REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



114/185 



1021/341 

CTA GTC CAC CGG ACA TGC GTG ACG CCG CTG 
leu val his arg thr cys val thr pro leu 
1081/361 

CAG CGG GTT AAT GAT CCG AGG CTG AGC GCG 
gin arg val asn asp pro arg leu ser ala 
1141/381 

GAC CGC ATC CTG GAT GTC AGC TCC ACC CGC 
asp arg ile leu asp val ser ser thr arg 
1201/401 

ACC GGC CGG GCG ATC AAC TTG CTC AGC ACC 
thr gly arg ala ile asn leu leu ser thr 
1261/421 

GAT TTT AGC CCC GAG GAA CAG CAG GGT TCG 
asp phe ser pro glu glu gin gin gly ser 
1321/441 

ACC GCG CCC CGG CGG TTG TCC CCG CGG GTG 
thr ala pro arg arg leu ser pro arg val 
1381/461 

GCC GCG CTG GCC GCC GCG GGA ACA AAC CCG 
ala ala leu ala ala ala gly thr asn pro 
1441/481 

TTC GTT CGG ATC GCG CAT GAA TCG ATC ACC 
phe val arg ile ala his glu ser ile thr 
1501/501 

CTG TGG CGC AGC TTG GAG CCG AAT GCC GCG 
leu trp arg ser leu glu pro asn ala ala 
1561/521 

TCG TGG AGC CTG GCC AGC GAC GAC GCG CAG 
ser trp ser leu ala ser asp asp ala gin 
1621/541 

CGG TCT GGC CTG GCC GTG CCG CGA CCA CTA 
arg ser gly leu ala val pro arg pro leu 
1681/561 

ACC GAG CCA CCG GAA CCC CCG GGC GCT TAC 
thr glu pro pro glu pro pro gly ala tvr 
1741/581 

ATC ACC ACG CAG ATC GGC GGG CAG GTT GCC 
ile thr thr gin ile gly gly gin val ala 
1801/601 

ATC GAT GAC CGC ACC GGG CTG ACC GGC GTG 
ile asp asp arg thr gly leu thr gly val 
1861/621 

TTG CGC GCG CTG AGC CAA TCG CTA CCA CCC 
leu arg ala leu ser gin ser leu pro oro 
1921/641 

CTG GCC GTC GTT GGA AAG ACG ATC GAC GAT 
leu ala val val gly lys thr ile asp aso 
1981/661 

GGC GGC TCC TAC ACT CTG GCC ACC GAG CAC 
gly gly ser tyr thr leu ala thr glu his 



1051/351 



CCT TTT GCC 


CAA 


GCC 


GAC 


CTG 


GAT 


GCT 


TTG 


pro phe ala 


gin 


ala 


asp 


leu 


asp 


ala 


leu 


1111/371 














ATC GCA ACC 


ATC 


AGC 


CCC 


GCC 


GAC 


ATC 


GTC 


ile ala thr 


ile 


ser 


pro 


ala 


asp 


ile 


val 


1171/391 














GGC GCA ACC 


GTG 


CTG 


CCC 


GAC 


GGC 


CCG 


TTG 


gly ala thr 


val 


leu 


pro 


asp 


gly 


pro 


leu 


1231/411 










CAC GGC AAC 


ACG 


GTT 


GCC 


GTC 


GCG 


GCC 


GCC 


his gly asn 


thr 


val 


ala 


val 


ala 


ala 


ala 


1291/431 
















TCC CAG ATC 


GGC 


TCC 


GCG 


CTC 


TTA 


CCC 


GCT 


ser gin ile 


gly 


ser 


ala 


leu 


leu 


pro 


ala 


1351/451 














GTA GCG GCG 


CCG 


TTT 


GAT 


CCC 


GCG 


GTC 


GGG 


val ala ala 


pro 


phe 


asp 


pro 


ala 


val 


gly 


1411/471 














ACC GTT CCT 


ACC 


TAT 


CTA 


GAT 


CCC 


TCG 


TTG 


thr val pro 


thr 


tyr 


leu 


asp 


pro 


ser 


leu 


1471/491 












GCG CGC CGC 


CAG 


GAC 


GCC 


TTG 


GGC 


GCA 


ATG 


ala arg arg 


gin 


asp 


ala 


leu 


gly 


ala 


met 


1531/511 














CCC CGT ACC 


CAA 


ATC 


CTG 


GTG 


CCG 


CCG 


GCG 


pro arg thr 


gin 


ile 


leu 


val 


pro 


pro 


ala 


1591/531 












GTC ATC CTG 


ACC 


GCG 


CTG 


GCC 


ACC 


GCC 


ATC 


val ile leu 


thr 


ala 


leu 


ala 


thr 


ala 


ile 


1551/551 
















CCG GCG GTG 


ATC 


GCT 


GAC 


GCC 


GCG 


GCC 


CGC 


pro ala val 


ile 


ala 


asp 


ala 


ala 


ala 


arg 


1711/571 














AGC GCC GCT 


CGC 


GGC 


CGG 


TTC 


AAT 


GAC 


GAC 


ser ala ala 


arg 


gly 


arg 


phe 


asn 


asp 


asp 


1771/591 












CGG CTA TGG 


AAG 


CTG 


ACC 


TCG 


GCG 


TTG 


ACC 


arg leu trp 


lys 


leu 


thr 


ser 


ala 


leu 


thr 


1831/611 
















CAG TAC ACC 


GCA 


CCA 


CTA 


CGC 


GAG 


GAC 


ATG 


gin tyr thr 


ala 


pro 


leu 


arg 


glu 


asp 


met 


1891/631 










GAT ACC CGC 


AAC 


GGG 


CTG 


GCC 


CAG 


CAG 


CGG 


asp thr arg 


asn 


gly leu 


ala 


gin 


gin 


arg 


1951/651 










CTT TTC GGC 


GCG 


GTG 


ACC 


ATC 


GTC 


AAC 


CCG 


leu phe gly 


ala 


val 


thr 


ile 


val 


asn 


pro 


2011/671 














AGT CCG CTG 


CCG 


TTG 


GCG 


CTG 


CAT 


AAT 


GGC 


ser pro leu 


pro 


leu 


ala 


leu 


his 


asn 


gly 



SEQ ID 36F (suite 1) 
FIGURE 36F (suite 1) 
FEU1LLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



115/185 



PCT7FR98/01813 



2041/681 

CTC GCC GTG CCA ATC CGG GTC CGG CTA CAG 
leu ala val pro ile arg val arg leu gin 
2101/701 

GAT GTC GGT CAG ATC GAG CTA CCG CCC GGG 
asp val gly gin ile glu leu pro pro gly 
2161/721 

AAC TTC ACA CAG CGG GTT GCC GTC GAC GTG 
asn phe thr gin arg val ala val asp val 
2221/741 

GGT GAA CCG GTG CGG TTG TCG GTG CAC TCC 
gly glu pro val arg leu ser val his ser 
2281/761 

ACG CTA TCC GCT GCG GCC GTG CTG GTA ACG 
thr leu ser ala ala ala val leu val thr 
2341/781 

CGT GGC CAG CCT GAT CGC GCC GAC CTG GAT 
arg gly gin pro asp arg ala asp leu asp 
2401/801 

CCG CAG CGC CGT GCC GTA GCC AGT CGG GAT 
pro gin arg arg ala val ala ser arg asp 



2071/691 

GTC GAT GCT CCG CCC GGG ATG ACG GTG GCC 
val asp ala pro pro gly met thr val ala 
2131/711 

TAC CTG CCG CTA CGA GTA CCA ATC GAG GTG 
tyr leu pro leu arg val pro ile glu val 
2191/731 

TCG CTG CGG ACC CCC GAC GGC GTC GCG CTG 
ser leu arg thr pro asp gly val ala leu 
2251/751 

AAC GCC TAC GGC AAG GTG TTG TTC GCG ATC 
asn ala tyr gly lys val leu phe ala ile 
2311/771 

CTG GCG GGC CGG CGC CTT TGG CAC CGG TTC 
leu ala gly arg arg leu trp his arg phe 
2371/791 

CGC CCC GAC CTG CCT ACC GGC AAA CAC GCC 
arg pro asp leu pro thr gly lys his ala 
2431/811 

GAC GAA AAG CAC CGG GTA TGA 
asp glu lys his arg val OPA 



SEQ ID 36F (suite 2) 



FIGURE 36F (suite 2) 



1/1 

ATC CGC GCG TTG GCG TCG CAT CCG AAC ATC 
ile arg ala leu ala ser his pro asn ile 
61/21 

CAC AGC GGC GCC CAA ATC ATG GCC GAC ACC 
his ser gly ala gin ile met ala asp thr 
121/41 

CTC AAC CTG CCC TGG CTG GCC ATG GGC GCC 
leu asn leu pro trp leu ala met gly ala 
181/61 

GCA GCC GGG CAG CTT CGA GAG TTG TTG TCC 

ala ala gly gin leu arg glu leu leu ser 

241/81 

CGC AAG ATC 

arg lys ile 



31/11 

GTC GGA GTC AAG GAC GCC AAA GCC GAC CTG 
val gly val lys asp ala lys ala asp leu 
91/31 

GGA CTG GCC TAC TAT TCC GGC GAC GAC GCG 
gly leu ala tyr tyr ser gly asp asp ala 
151/51 

ACG GGC TTC ATC AGC GTG ATT GCC CAC CTG 
thr gly phe ile ser val ile ala his leu 
211/71 

GCC TTC GGT TCT GGG GAT ATC GCC ACC GCC 
ala phe gly ser gly asp ile ala thr ala 



SEQ ID N° 37A 



FIGURE 37A 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



116/185 



1/1 31/11 

GAT CCG CGC GTT GGC GTC GCA TCC GAA CAT CGT CGG AGT CAA GGA CGC CAA AGC CGA CCT 
asp pro arg val gly val ala ser glu his arg arg ser gin gly arg gin ser arg pro 
61/21 91/31 

GCA CAG CGG CGC CCA AAT CAT GGC CGA CAC CGG ACT GGC CTA CTA TTC CGG CGA CGA CGC 
ala gin arg arg pro asn his gly arg his arg thr gly leu leu phe arg arg arg arg 
121/41 151/51 

GCT CAA CCT GCC CTG GCT GGC CAT GGG CGC CAC GGG CTT CAT CAG CGT GAT TGC CCA CCT 
ala gin pro ala leu ala gly his gly arg his gly leu his gin arg asp cys pro pro 
181/61 211/71 

GGC AGC CGG GCA GCT TCG AGA GTT GTT GTC CGC CTT CGG TTC TGG GGA TAT CGC CAC CGC 
gly ser arg ala ala ser arg val val val arg leu arg phe trp gly tyr arg his arg 
241/81 

CCG CAA GAT C 
pro gin asp 



SEQ ID N° 37B 
FIGURE 37B 



1/1 

TCC GCG CGT TGG CGT CGC ATC 
ser ala arg trp arg arg ile 
61/21 

ACA GCG GCG CCC AAA TCA TGG 
thr ala ala pro lys ser trp 
121/41 

TCA ACC TGC CCT GGC TGG CCA 
ser thr cys pro gly trp pro 
181/61 

CAG CCG GGC AGC TTC GAG AGT 
gin pro gly ser phe glu ser 
241/81 
GCA AGA TC 
ala arg 









31/11 




CGA 


ACA 


TCG 


TCG GAG 


TCA 


arg 


thr 


ser 


ser glu 


ser 








91/31 




CCG 


ACA 


CCG 


GAC TGG 


CCT 


pro 


thr 


pro 


asp trp 


pro 








151/51 




TGG 


GCG 


CCA 


CGG GCT 


TCA 


trp 


ala 


pro 


arg ala 


ser 








211/71 




TGT 


TGT 


CCG 


CCT TCG 


GTT 


cys 


cys 


pro 


pro ser 


val 



SEQ ID N° 37C 
FIGURE 37C 



AGG ACG CCA AAG CCG ACC TGC 
arg thr pro lys pro thr cys 

ACT ATT CCG GCG ACG ACG CGC 
thr ile pro ala thr thr arg 

TCA GCG TGA TTG CCC ACC TGG 
ser ala OPA leu pro thr trp 

CTG GGG ATA TCG CCA CCG CCC 
leu gly ile ser pro pro pro 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



117/185 



Sequence codante Rv2753c predite par Cole et al . , 1998 (Nature 393 537-544) 
contenant Seq 37A 

1/1 31/11 

GTG ACC ACC GTC GGA TTC GAC GTC GCA GCG CGC CTA GGA ACC CTG CTG ACC GCG ATG GTG 
val thr thr val gly phe asp val ala ala arg leu gly thr leu leu thr ala met val 
61/21 91/31 

ACA CCG TTT AGC GGC GAT GGC TCC CTG GAC ACC GCC ACC GCG GCG CGG CTG GCC AAC CAC 
thr pro phe ser gly asp gly ser leu asp thr ala thr ala ala arg leu ala asn his 
121/41 151/51 

CTG GTC GAT CAG GGG TGC GAC GGT CTG GTG GTC TCG GGC ACC ACC GGC GAG TCG CCG ACC 
leu val asp gin gly cys asp gly leu val val ser gly thr thr gly glu ser pro thr 
181/61 211/71 

ACC ACC GAC GGG GAG AAA ATC GAG CTG CTG CGG GCC GTC TTG GAA GCG GTG GGG GAC CGG 
thr thr asp gly glu lys ile glu leu leu arg ala val leu glu ala val gly asp arg 
241/81 271/91 

GCC CGT GTT ATC GCC GGT GCC GGC ACC TAT GAC ACC GCG CAC AGC ATC CGG CTG GCC AAG 
ala arg val ile ala gly ala gly thr tyr asp thr ala his ser ile arg leu ala lys 
301/101 331/111 

GCT TGT GCG GCC GAG GGT GCG CAC GGG CTG CTG GTG GTC ACG CCC TAC TAT TCC AAG CCG 
ala cys ala ala glu gly ala his gly leu leu val val thr pro tyr tyr ser lys pro 
361/121 391/131 

CCG CAG CGG GGG CTG CAA GCC CAT TTC ACC GCC GTC GCC GAC GCG ACC GAG CTG CCG ATG 
pro gin arg gly leu gin ala his phe thr ala val ala asp ala thr glu leu pro met 
421/141 451/151 

CTG CTC TAT GAC ATC CCG GGG CGG TCG GCG GTG CCG ATC GAG CCC GAC ACG ATC CGC GCG 
leu leu tyr asp ile pro gly arg ser ala val pro ile glu pro asp thr ile arg ala 
481/161 511/171 

TTG GCG TCG CAT CCG AAC ATC GTC GGA GTC A*lG GAC GCC AAA GCC GAC CTG CAC AGC GGC 
leu ala ser his pro asn ile val gly val lys asp ala lys ala asp leu his ser gly 
541/181 571/191 

GCC CAA ATC ATG GCC GAC ACC GGA CTG GCC TAC TAT TCC GGC GAC GAC GCG CTC AAC CTG 
ala gin ile met ala asp thr gly leu ala tyr tyr ser gly asp asp ala leu asn leu 
601/201 631/211 

CCC TGG CTG GCC ATG GGC GCC ACG GGC TTC ATC AGC GTG ATT GCC CAC CTG GCA GCC GGG 
pro trp leu ala met gly ala thr gly phe ile ser val ile ala his leu ala ala gly 
661/221 691/231 

CAG CTT CGA GAG TTG TTG TCC GCC TTC GGT TCT GGG GAT ATC GCC ACC GCC CGC AAG ATC 
gin leu arg glu leu leu ser ala phe gly ser gly asp ile ala thr ala arg lys ile 
721/241 751/251 

AAC ATT GCG GTC GCC CCG CTG TGC AAC GCG ATG AGC CGC CTG GGT GGG GTG ACG TTG TCC 
asn ile ala val ala pro leu cys asn ala met ser arg leu gly gly val thr leu ser 
781/261 811/271 

AAG GCG GGC TTG CGG CTG CAG GGC ATC GAC GTC GGT GAT CCC CGG CTG CCC CAG GTG GCC 
lys ala gly leu arg leu gin gly ile asp val gly asp pro arg leu pro gin val ala 
841/281 871/291 

GCG ACA CCG GAG CAG ATC GAC GCG TTG GCC GCC GAC ATG CGC GCG GCC TCG GTG CTT CGG 
ala thr pro glu gin ile asp ala leu ala ala asp met arg ala ala ser val leu arg 



901/301 

TGA 

OPA 



SEQ ID N° 37D 
FIGURE 37D 
FEUILLE DE REM PLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



118/185 



ORF d'apres Cole et al., 1998 (Nature 393 537-544) nontenant Rv2753c 
1/1 31/11 

TAA GGT GAG CGC CGT GGC CGA GAC CGC GCC GCT GCG CGT GCA ACT GAT CGC CAA GAC CGA 
OCH gly glu arg arg gly arg asp arg ala ala ala arg ala thr asp arg gin asp arg 
61/21 91/31 

CTT CTT GGC CCC ACC CGA CGT GCC CTG GAC CAC CGA CGC CGA CGG CGG ACC CGC GCT GGT 
leu leu gly pro thr arg arg ala leu asp his arg arg arg arg arg thr arg ala gly 
121/41 151/51 

CGA GTT CGC CGG CCG GGC CTG CTA TCA GAG CTG GTC CAA GCC CAA TCC CAA GAC CGC CAC 
arg val arg arg pro gly leu leu ser glu leu val gin ala gin ser gin asp arg his 
181/61 211/71 

CAA CGC CGG CTA CCT CCG GCA CAT CAT CGA CGT CGG ACA TTT CTC GGT GCT AGA GCA TGC 
gin arg arg leu pro pro ala his his arg arg arg thr phe leu gly ala arg ala cys 
241/81 271/91 

CAG CGT GTC GTT CTA CAT CAC CGG GAT CTC GCG ATC GTG CAC CCA CGA GCT GAT CCG CCA 
gin arg val val leu his his arg asp leu ala ile val his pro arg ala asp pro pro 
301/101 331/111 

CCG GCA TTT CTC CTA CTC GCA GCT CTC CCA GCG CTA CGT ACC CGA GAA GGA CTC GCG GGT 
pro ala phe leu leu leu ala ala leu pro ala leu arg thr arg glu gly leu ala gly 
361/121 391/131 

CGT CGT GCC GCC CGG CAT GGA GGA CGA CGC CGA CCT GCG CCA CAT CCT GAC CGA GGC CGC 
arg arg ala ala arg his gly gly arg arg arg pro ala pro his pro asp arg gly arg 
421/141 451/151 

CGA CGC CGC CCG CGC CAC CTA CAG CGA GCT GCT GGC CAA GCT GGA AGC CAA GTT CGC CGA 
arg arg arg pro arg his leu gin arg ala ala gly gin ala gly ser gin val arg arg 
481/161 511/171 

CCA ACC CAA CGC GAT CCT GCG CCG CAA GCA GGC CCG CCA AGC CGC CCG CGC GGT GCT GCC 
pro thr gin arg asp pro ala pro gin ala gly pro pro ser arg pro arg gly ala ala 
541/181 571/191 

CAA CGC CAC CGA AAC CCG CAT CGT GGT GAC CGG CAA CTA CCG GGC CTG GCG GCA CTT CAT 
gin arg his arg asn pro his arg gly asp arg gin leu pro gly leu ala ala leu his 
601/201 631/211 

CGC AAT GCG GGC CAG CGA GCA CGC CGA CGT GGA AAT CCG GCG ACT GGC CAT CGA ATG CCT 
arg asn ala gly gin arg ala arg arg arg gly asn pro ala thr gly his arg met pro 
661/221 691/231 

GCG CCA GCT CGC CGC CGT GGC CCC CGC GGT GTT CGC CGA CTT CGA GGT GAC CAC CCT GGC 
ala pro ala arg arg arg gly pro arg gly val arg arg leu arg gly asp his pro gly 
721/241 751/251 

CGA CGG CAC CGA GGT GGC GAC CAG CCC GTT GGC GAC CGA AGC CTG AGG CGG CGT GTC GCT 
arg arg his arg gly gly asp gin pro val gly asp arg ser leu arg arg arg val ala 
781/261 811/271 

GGA CAA ACA CGC GCG CTC GCG GCC GGG ATA AAG CGC CAG GTA ACC TTG GGA GCC GTG ACC 
gly gin thr arg ala leu ala ala gly ile lys arg gin val thr leu gly ala val thr 
841/281 871/291 

ACC GTC GGA TTC GAC GTC GCA GCG CGC CTA GGA ACC CTG CTG ACC GCG ATG GTG ACA CCG 
thr val gly phe asp val ala ala arg leu gly thr leu leu thr ala met val thr pro 
901/301 931/311 

TTT AGC GGC GAT GGC TCC CTG GAC ACC GCC ACC GCG GCG CGG CTG GCC AAC CAC CTG GTC 
phe ser gly asp gly ser leu asp thr ala thr ala ala arg leu ala asn his leu val 
961/321 991/331 

GAT CAG GGG TGC GAC GGT CTG GTG GTC TCG GGC ACC ACC GGC GAG TCG CCG ACC ACC ACC 
asp gin gly cys asp gly leu val val ser gly thr thr gly glu ser pro thr thr thr 



SEQ ID N° 37F 



FIGURE 37F 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



119/185 



1021/341 1051/351 

GAC GGG GAG AAA ATC GAG CTG CTG CGG GCC GTC TTG GAA GCG GTG GGG GAC CGG GCC CGT 
asp gly glu lys ile glu leu leu arg ala val leu glu ala val gly asp arg ala arg 
1081/361 1111/371 

GTT ATC GCC GGT GCC GGC ACC TAT GAC ACC GCG CAC AGC ATC CGG CTG GCC AAG GCT TGT 
val ile ala gly ala gly thr tyr asp thr ala his ser ile arg leu ala lys ala cys 
1141/381 1171/391 

GCG GCC GAG GGT GCG CAC GGG CTG CTG GTG GTC ACG CCC TAC TAT TCC AAG CCG CCG CAG 
ala ala glu gly ala his gly leu leu val val thr pro tyr tyr ser lys pro pro gin 
1201/401 1231/411 

CGG GGG CTG CAA GCC CAT TTC ACC GCC GTC GCC GAC GCG ACC GAG CTG CCG ATG CTG CTC 
arg gly leu gin ala his phe thr ala val ala asp ala thr glu leu pro met leu leu 
1261/421 1291/431 

TAT GAC ATC CCG GGG CGG TCG GCG GTG CCG ATC GAG CCC GAC ACG ATC CGC GCG TTG GCG 
tyr asp ile pro gly arg ser ala val pro ile glu pro asp thr ile arg ala leu ala 
1321/441 1351/451 

TCG CAT CCG AAC ATC GTC GGA GTC AAG GAC GCC AAA GCC GAC CTG CAC AGC GGC GCC CAA 
ser his pro asn ile val gly val lys asp ala lys ala asp leu his ser gly ala gin 
1381/461 1411/471 

ATC ATG GCC GAC ACC GGA CTG GCC TAC TAT TCC GGC GAC GAC GCG CTC A^C CTG CCC TGG 
ile met ala asp thr gly leu ala tyr tyr ser gly asp asp ala leu asn leu pro trp 
1441/481 1471/491 

CTG GCC ATG GGC GCC ACG GGC TTC ATC AGC GTG ATT GCC CAC CTG GCA GCC GGG CAG CTT 
leu ala met gly ala thr gly phe ile ser val ile ala his leu ala ala gly gin leu 
1501/501 1531/511 

CGA GAG TTG TTG TCC GCC TTC GGT TCT GGG GAT ATC GCC ACC GCC CGC AAG ATC AAC ATT 
arg glu leu leu ser ala phe gly ser gly asp ile ala thr ala arg lys ile asn ile 
1561/521 . 1591/531 

GCG GTC GCC CCG CTG TGC AAC GCG ATG AGC CGC CTG GGT GGG GTG ACG TTG TCC AAG GCG 
ala val ala pro leu cys asn ala met ser arg leu gly gly val thr leu ser lys ala 
1621/541 1651/551 

GGC TTG CGG CTG CAG GGC ATC GAC GTC GGT GAT CCC CGG CTG CCC CAG GTG GCC GCG ACA 
gly leu arg leu gin gly ile asp val gly asp pro arg leu pro gin val ala ala thr 
1681/561 1711/571 

CCG GAG CAG ATC GAC GCG TTG GCC GCC GAC ATG CGC GCG GCC TCG GTG CTT CGG TGA 
pro glu gin ile asp ala leu ala ala asp met arg ala ala ser val leu arg OPA 



SEQ ID N° 37F (suite 1) 
FIGURE 37F (suite 1) 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



120/185 



1/1 

GCG GTG AAC TGG TGG GCC CGG ATG GTT CAA 
ala val asn trp trp ala arg met val gin 
61/21 

AGA CGA CGG ATG GAA GGA GAT GCT GGC GCC 
arg arg arg met glu gly asp ala gly ala 
121/41 

TCG TCG TCT ACG GAG GTG AAG GCG GCG GAT 
ser ser ser thr glu val lys ala ala asp 
181/61 

ACT GGC CCG CAG GTG AAG GCG GCG GAT TCG 
thr gly pro gin val lys ala ala asp ser 
241/81 

GAC GCG TGC CCA GAA CAG GCC CTC GTC GAG 
asp ala cys pro glu gin ala leu val glu 
301/101 

CTT GTT GGC ATT GCG GCG ACG CTG CTC GCG 
leu val gly ile ala ala thr leu leu ala 
361/121 

TTT GCG TTG CGC TCA CAC CAG GAA AGC CAA 
phe ala leu arg ser his gin glu ser gin 
421/141 

GAG GCC GCT AAG GAT TGC GTT GCG GCC ACG 
glu ala ala lys asp cys val ala ala thr 
481/161 

AGC ATG CAG AAG ATC 
ser met gin lys ile 



31/11 

GTA CGC CGT CGC AAA CTC GAG CAC AAC AGG 
val arg arg arg lys leu glu his asn arg 
91/31 

GGC CAG CTG AAC CCT GCC GAT GCG AAT AAG 
gly gin leu asn pro ala asp ala asn lys 
151/51 

TCG GCG GAA TCT GAC GCC GGA GCC GAC CAG 
ser ala glu ser asp ala gly ala asp gin 
211/71 

GCG GAA TCT GAC GCC GGA GAG CTC GGC GAG 
ala glu ser asp ala gly glu leu gly glu 
271/91 

CGG CGC CCG TCG CGG TTG CGG CGA GGC TGG 
arg arg pro ser arg leu arg arg gly trp 
331/111 

TTG GCC GGT GGC CTT GGC GCA GCG GGT TAT 
leu ala gly gly leu gly ala ala gly tyr 
391/131 

TCA ATC GCG CGC GAG GAC CTT GCG GCC ATT 
ser ile ala arg glu asp leu ala ala ile 
451/151 

CAG GCA CCC GAT GCT GGG GCG ATG TCG GCT 
gin ala pro asp ala gly ala met ser ala 



SEQ ID N° 38A 



FIGURE 38A 



1/1 

CAG CGG TGA ACT GGT GGG CCC GGA TGG TTC 
gin arg CPA thr gly gly pro gly trp phe 
61/21 

GGA GAC GAC GGA TGG AAG GAG ATG CTG GCG 
gly asp asp gly trp lys glu met leu ala 
121/41 

AGT CGT CGT CTA CGG AGG TGA AGG CGG CGG 
ser arg arg leu arg arg OPA arg arg arg 
181/61 

AGA CTG GCC CGC AGG TGA AGG CGG CGG ATT 
arg leu ala arg arg OPA arg arg arg ile 
241/81 

AGG ACG CGT GCC CAG AAC AGG CCC TCG TCG 
arg thr arg ala gin asn arg pro ser ser 
301/101 

GGC TTG TTG GCA TTG CGG CGA CGC TGC TCG 
gly leu leu ala leu arg arg arg cys ser 
361/121 

ATT TTG CGT TGC GCT CAC ACC AGG AAA GCC 
ile leu arg cys ala his thr arg lys ala 
421/141 

TTG AGG CCG CTA AGG ATT GCG TTG CGG CCA 
leu arg pro leu arg ile ala leu arg pro 
481/161 

CTA GCA TGC AGA AGA TC 
leu ala cys arg arg 



31/11 

AAG TAC GCC GTC GCA AAC TCG AGC ACA ACA 
lys tyr ala val ala asn ser ser thr thr 
91/31 

CCG GCC AGC TGA ACC CTG CCG ATG CGA ATA 
pro ala ser OPA thr leu pro met arg ile 
151/51 

ATT CGG CGG AAT CTG ACG CCG GAG CCG ACC 
ile arg arg asn leu thr pro glu pro thr 
211/71 

CGG CGG AAT CTG ACG CCG GAG AGC TCG GCG 
arg arg asn leu thr pro glu ser ser ala 
271/91 

AGC GGC GCC CGT CGC GGT TGC GGC GAG GCT 
ser gly ala arg arg gly cys gly glu ala 
331/111 

CGT TGG CCG GTG GCC TTG GCG CAG CGG GTT 
arg trp pro val ala leu ala gin arg val 
391/131 

AAT CAA TCG CGC GCG AGG ACC TTG CGG CCA 
asn gin ser arg ala arg thr leu arg pro 
451/151 

CGC AGG CAC CCG ATG CTG GGG CGA TGT CGG 
arg arg his pro met leu gly arg cys arg 



SEQ ID N° 38B 
FEUILLE DE REIVfPl»C@Uli(97(REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



121/185 



1/1 ' 31/11 



AGC GGT 


C A A 




GTG 


GGC 


CCG GAT 


GGT 


TCA 


AGT ACG 


CCG 


TCG 


CAA 


ACT 


CGA 


GCA 


CAA 


CAG 


ser gly 


glu 


leu 


val 


gly pro asp 


gly 


ser 


ser thr 


pro 


ser 


gin 


tnr 


arg 


aia 


gin 


gin 


01/ ^1 
















91/31 


















GAG ACG 


ACG 


f AT 

GA1 


GGA AGG 


AGA TGC 


TGG 


CGC 


CGG CCA 


GCT 


GAA 


CCC 


TGC 


CGA 


TGC 


GAA 


TAA 


glu tnr 


cnr 


asp 


gly 


arg 


arg cys 


trp 


arg 


arg pro 


ala 


glu pro 


cys 


arg 


cys 


glu 


OCH 


121/41 
















151/51 


















GTC GIL 


G1U 


1AC- 


GGA 


GGT 


GAA GGC 


GGC 


GGA 


TTC GGC 


GGA 


ATC 


TGA 


CGC 


CGG 


AGC 


CGA 


CCA 


val val 


vai 


tyr 


gly gly glu gly 


gly gly 


phe gly gly 


ile 


OPA 


arg 


arg 


ser 


arg 


pro 


181/ 61 
















211/71 


















GAC TGG 


ccc 


GCA 


GGT 


GAA 


GGC GGC 


GGA 


TTC 


GGC GGA 


ATC 


TGA 


CGC 


CGG 


AGA 


GCT 


CGG 


CGA 


dap L.J.£J 


£J JL VJ 




gly 


glu 


gly gly 


gly phe 


gly gly 


ile 


OPA 


arg 


arg 


arg 


aid 


arg 


arg 


241/81 
















271/91 


















GGA CGC 


GTG 


CCC 


AGA 


ACA 


GGC CCT 


CGT 


CGA 


GCG GCG 


CCC 


GTC 


GCG 


GTT 


GCG 


GCG 


AGG 


CTG 


gly arg 


val 


pro 


arg 


thr 


gly pro 


arg 


arg 


ala ala 


pro 


val 


ala 


val 


ala 


ala 


arg 


leu 


301/101 
















331/111 


















GCT TGT 


TGG 


CAT 


TGC 


GGC 


GAC GCT 


GCT 


CGC 


GTT GGC 


CGG 


TGG 


CCT 


TGG 


CGC 


AGC 


GGG 


TTA 


ala cys 


trp 


his 


cys 


gly 


asp ala 


ala 


arg 


val gly 


arg 


trp 


pro 


trp 


arg 


ser 


gly 


leu 


361/121 
















391/131 


















TTT TGC 


GTT 


GCG 


CTC 


ACA 


CCA GGA 


AAG 


CCA 


ATC AAT 


CGC 


GCG 


CGA 


GGA 


CCT 


TGC 


GGC 


CAT 


phe cys 


val 


ala 


leu 


thr pro gly 


lys 


pro 


ile asn 


arg 


ala 


arg 


gly pro 


cys 


gly 


his 


421/141 
















451/151 


















TGA GGC 


CGC 


TAA 


GGA 


TTG 


CGT TGC 


GGC 


CAC 


GCA GGC 


ACC 


CGA 


TGC 


TGG 


GGC 


GAT 


GTC 


GGC 


OPA gly 


arg 


OCH 


gly 


leu 


arg cys 


gly his 


ala gly 


thr 


arg 


cys 


trp gly 


asp 


val 


gly 



481/161 
TAG CAT GCA GAA GAT C 
AMB his ala glu asp 



SEQ ID N° 38C 
FIGURE 38C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



122/185 



Sequence Rv0175 predite par 
seq38A 

1/1 

GTG AAG GCG GCG GAT TCG GCG 
val lys ala ala asp ser ala 
61/21 

AAG GCG GCG GAT TCG GCG GAA 
lys ala ala asp ser ala glu 
121/41 

CAG GCC CTC GTC GAG CGG CGC 
gin ala leu val glu arg arg 
181/61 

GCG ACG CTG CTC GCG TTG GCC 
ala thr leu leu ala leu ala 
241/81 

CAC CAG GAA AGC CAA TCA ATC 
his gin glu ser gin ser ile 
301/101 

TGC GTT GCG GCC ACG CAG GCA 
cys val ala ala thr gin ala 
361/121 

ATC GAG TGT GGC ACC GGT GAT 
ile glu cys gly thr gly asp 
421/141 

GAG GCG TAT CAA GCG GCC AGC 
glu ala tyr gin ala ala ser 
481/161 

CGC AAC AAC AAT GAC GGG TCG 
arg asn asn asn asp gly ser 
541/181 

ACC GAC TCG GAT GCC CAT GAA 
thr asp ser asp ala his glu 
601/201 

GGC CGC TAT AAG ATC GCC AAA 
gly arg tyr lys ile ala lys 



Cole et al., 1998 (Nature 



31/11 

GAA TCT GAC GCC GGA GCC GAC 
glu ser asp ala gly ala asp 
91/31 

TCT GAC GCC GGA GAG CTC GGC 
ser asp ala gly glu leu gly 
151/51 

CCG TCG CGG TTG CGG CGA GGC 
pro ser arg leu arg arg gly 
211/71 

GGT GGC CTT GGC GCA GCG GGT 
gly gly leu gly ala ala gly 
271/91 

GCG CGC GAG GAC CTT GCG GCC 
ala arg glu asp leu ala ala 
331/111 

CCC GAT GCT GGG GCG ATG TCG 
pro asp ala gly ala met ser 
391/131 

TTC GGT GCC CAG GCG TCG TTG 
phe gly ala gin ala ser leu 
451/151 

GTC CAC GTG CAA GTG ACC GAT 
val his val gin val thr asp 
511/171 

GTC GAT GTT CTG GTG GCG CTC 
val asp val leu val ala leu 
571/191 

GTC GGC TAC CGT CTT CGG GTC 
val gly tyr arg leu arg val 
631/211 

CTC GAC CAG GTG ACG AAG TGA 
leu asp gin val thr lys OPA 



393 537-544) et contenant 



CAG 


ACT 


GGC 


CCG 


CAG 


GTG 


gin 


thr 


gly pro 


win 

gin 


val 


GAG 


GAC 




i bL 


CCA 


GAA 


glu 


asp 


ala 


cys 


pro 


glu 


TGG 


CTT 


GTT 


GGC 


ATT 


GCG 


trp 


leu 


val 


gly 


lie 


aia 


TAT 


TTT 


GCG 


TTG 


CGC 


TCA 


tyr phe 


ala 


leu 


arg 


ser 


ATT 


GAG 


GCC 


GCT 


AAG 


GAT 


ile 


glu 


ala 


ala 


lys 


asp 


GCT 


AGC 


ATG 


CAG 


AAG 


ATC 


ala 


ser 


met 


gin 


lys 


lie 


TAC 


ACC 


AGC 


ATG 


CTC 


GTC 


tyr 


thr 


ser 


met 


leu 


val 


ATG 


CGC 


GCG 


GCG 


GTC 


GAG 


met 


arg 


ala 


ala 


val 


glu 


CGG 


GTC 


AAG 


GTG 


TCC 


AAC 


arg 


val 


lys 


val 


ser 


asn 


CGG 


ATG 


GCA 


CTG 


GAT 


GAG 


arg 


met 


ala 


leu 


asp 


glu 



SEQ ID N° 38D 
FIGURE 38D 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



123/185 



ORF d'apres Cole et al ♦ , 1998 (Nature 393 537-544) Contenant Rv0175 
1/1 31/11 

TGA ACT GGT GGG GCC GGA TGG TGT CAA GTA CGC CGT CGC AAA CTC GAG CAC AAC AGG AGA 
OPA thr gly gly ala gly trp cys gin val arg arg arg lys leu glu his asn arg arg 
61/21 91/31 

CGA CGG ATG GAA GGA GAT GCT GGC GCC GGC CAG CTG AAC CCT GCC GAT GCG AAT AAG TCG 
arg arg met glu gly asp ala gly ala gly gin leu asn pro ala asp ala asn lys ser 
121/41 151/51 

TCG TCT ACG GAG GTG AAG GCG GCG GAT TCG GCG GAA TCT GAC GCC GGA GCC GAC CAG ACT 
ser ser thr glu val lys ala ala asp ser ala glu ser asp ala gly ala asp gin thr 
181/61 211/71 

GGC CCG CAG GTG AAG GCG GCG GAT TCG GCG GAA TCT GAC GCC GGA GAG CTC GGC GAG GAC 
gly pro gin val lys ala ala asp ser ala glu ser asp ala gly glu leu gly glu asp 
241/81 271/91 

GCG TGC CCA GAA CAG GCC CTC GTC GAG CGG CGC CCG TCG CGG TTG CGG CGA GGC TGG CTT 
ala cys pro glu gin ala leu val glu arg arg pro ser arg leu arg arg gly trp leu 
301/101 331/111 

GTT GGC ATT GCG GCG ACG CTG CTC GCG TTG GCC GGT GGC CTT GGC GCA GCG GG? TAT TTT 
val gly ile ala ala thr leu leu ala leu ala gly gly leu gly ala ala gly tyr phe 
361/121 391/131 

GCG TTG CGC TCA CAC CAG GAA AGC CAA TCA ATC GCG CGC GAG GAC CTT GCG GCC ATT GAG 
ala leu arg ser his gin glu ser gin ser ile ala arg glu asp leu ala ala ile glu 
421/141 451/151 

GCC GCT AAG GAT TGC GTT GCG GCC ACG CAG GCA CCC GAT GCT GGG GCG ATG TCG GCT AGC 
ala ala lys asp cys val ala ala thr gin ala pro asp ala gly ala met ser ala ser 
481/161 511/171 

ATG CAG AAG ATC ATC GAG TGT GGC ACC GGT GAT TTC GGT GCC CAG GCG TCG TTG TAC ACC 
met gin lys ile ile glu cys gly thr gly asp phe gly ala gin ala ser leu tyr thr 
541/181 571/191 

AGC ATG CTC GTC GAG GCG TAT CAA GCG GCC AGC GTC CAC GTG CAA GTG ACC GAT ATG CGC 
ser met leu val glu ala tyr gin ala ala ser val his val gin val thr asp met arg 
601/201 631/211 

GCG GCG GTC GAG CGC AAC AAC AAT GAC GGG TCG GTC GAT GTT CTG GTG GCG CTC CGG GTC 
ala ala val glu arg asn asn asn asp gly ser val asp val leu val ala leu arg val 
661/221 691/231 

AAG GTG TCC AAC ACC GAC TCG GAT GCC CAT GAA GTC GGC TAC CGT CTT CGG GTC CGG ATG 
lys val ser asn thr asp ser asp ala his glu val gly tyr arg leu arg val arg met 
721/241 751/251 

GCA CTG GAT GAG GGC CGC TAT AAG ATC GCC AAA CTC GAC CAG GTG ACG AAG TGA 
ala leu asp glu gly arg tyr lys ile ala lys leu asp gin val thr lys OPA 



SEQ ID N° 38F 
FIGURE 38F 



FEU1LLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



124/185 



1/1 31/11 

ACA CCT CCC CCC CCG CCG CCG CTG CCG CCG GTT CCC TTT CCC AAG GAA TGT CCG GCG CCG 
thr pro pro pro pro pro pro leu pro pro val pro phe pro lys glu cys pro ala pro 
61/21 91/31 

GGC GTG ATG CAA GGC TGC CTT GAG AGC ACC AGC GGC TTG ATC ATG GGC ATC GAC AGC AAG 

gly val met gin gly cys leu glu ser thr ser gly leu ile met gly ile asp ser lys 

121/41 151/51 

ACC GCA CTG GTC GCC GAG CGC ATC ACC GGT GCC GTC GAG GAG ATC 

thr ala leu val ala glu arg ile thr gly ala val glu glu ile 



SEQ ID N° 39A 
FIGURE 39A 



1/1 31/11 

CAC CTC CCC CCC CGC CGC CGC TGC CGC CGG TTC CCT TTC CCA AGG AAT GTC CGG CGC CGG 
his leu pro pro arg arg arg cys arg arg phe pro phe pro arg asn val arg arg arg 
61/21 91/31 

GCG TGA TGC AAG GCT GCC TTG AGA GCA CCA GCG GCT TGA TCA TGG GCA TCG ACA GCA AGA 

ala OPA cys lys ala ala leu arg ala pro ala ala OPA ser trp ala ser thr ala arg 

121/41 151/51 

CCG CAC TGG TCG CCG AGC GCA TCA CCG GTG CCG TCG AGG AGA TC 

pro his trp ser pro ser ala ser pro val pro ser arg arg 



SEQ ID N° 39B 
FIGURE 39B 



1/1 

GAC ACC TCC CCC CCC GCC GCC 
asp thr ser pro pro ala ala 
61/21 

GGG CGT GAT GCA AGG CTG CCT 
gly arg asp ala arg leu pro 
121/41 

GAC CGC ACT GGT CGC CGA GCG 
asp arg thr gly arg arg ala 



31/11 

GCT GCC GCC GGT TCC CTT 
ala ala ala gly ser leu 
91/31 

TGA GAG CAC CAG CGG CTT 
OPA glu his gin arg leu 
151/51 

CAT CAC CGG TGC CGT CGA 
his his arg cys arg arg 



SEQ ID N° 39C 
FIGURE 39C 



TCC CAA GGA ATG TCC GGC GCC 
ser gin gly met ser gly ala 

GAT CAT GGG CAT CGA CAG CAA 
asp his gly his arg gin gin 

GGA GAT C 
gly asp 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



125/185 



Sequence codante Rv3006 predite par Cole et al., 1998 (Nature 393 537-544) et contenant 
seq39A 

1/1 31/11 

ATG TGG ACA ACG CGG TTG GTT CGA TCC GGA CTC GCC GCG CTG TGC GCG GCA GTG CTG GTA 
Met trp thr thr arg leu val arg ser gly leu ala ala leu cy3 ala ala val leu val 
61/21 91/31 

TCG AGC GGC TGC GCA CGG TTC AAC GAC GCT CAA TCT CAG CCG TTC ACC ACC GAA CCG GAG 
ser aer gly cys ala arg phe a3n asp ala gin ser gin pro phe thr thr glu pro glu 
121/41 151/51 

CTG CGG CCC CAA CCC AGC TCG ACA CCT CCC CCC CCG CCG CCG CTG CCG CCG GTT CCC TTT 
leu arg pro gin pro ser ser thr pro pro pro pro pro pro leu pro pro val pro phe 
181/61 211/71 

CCC AAG GAA TGT CCG GCG CCG GGC GTG ATG CAA GGC TGC CTT GAG AGC ACC AGC GGC TTG 
pro lys glu cys pro ala pro gly val met gin gly cys leu glu ser thr ser gly leu 
241/81 271/91 

ATC ATG GGC ATC GAC AGC AAG ACC GCA CTG GTC GCC GAG CGC ATC ACC GGT GCC GTC GAG 
ile met gly ile asp ser lys thr ala leu val ala glu arg ile thr gly ala val glu 
301/101 331/111 

GAG ATC TCT ATC AGC GCC GAG CCG AAG GTA AAG ACG GTC ATC CCC GTG GAT CCT GCC GGT 
glu ile ser ile ser ala glu pro lys val lys thr val ile pro val asp pro ala gly 
361/121 391/131 

GAC GGT GGC TTG ATG GAC ATT GTG CTG TCG CCC ACC TAC TCG CAA GAC CGG CTG ATG TAC 
asp gly gly leu met asp ile val leu ser pro thr tyr ser gin asp arg leu met tyr 
421/141 451/151 

GCC TAC ATC AGC ACG CCC ACC GAC AAC CGG GTG GTG CGA GTG GCC GAC GGC GAC ATC CCC 
ala tyr ile ser thr pro thr asp asn arg val val arg val ala asp gly asp ile pro 
481/161 511/171 

AAG GAC ATC CTG ACC GGC ATC CCC AAA GGT GCT GCC GGT AAC ACC GGG GCG CTG ATC TTC 
lys asp ile leu thr gly ile pro lys gly ala ala gly asn thr gly ala leu ile phe 
541/181 571/191 

ACC AGT CCC ACC ACG CTG GTC GTG ATG ACC GGG GAT GCT GGC GAC CCG GCG TTG GCC GCC 
thr ser pro thr thr leu val val met thr gly asp ala gly asp pro ala leu ala ala 
601/201 6317211 

GAT CCC CAA TCG TTG GCC GGT AAG GTC CTG CGT ATC GAA CAG CCC ACC ACC ATC GGC CAG 
asp pro gin ser leu ala gly lys val leu arg ile glu gin pro thr thr ile gly gin 
661/221 691/231 

ACG CCG CCG ACG ACG GCG CTG TCT GGC ATC GGC TCC GGC GGC GGC TTG TGC ATC GAT CCG 
thr pro pro thr thr ala leu ser gly ile gly ser gly gly gly leu cys ile asp pro 
721/241 751/251 

GTC GAC GGC TCG CTA TAT GTC GCC GAC CGC ACG CCA ACG GCG GAC CGA TTG CAG CGC ATC 
val asp gly ser leu tyr val ala asp arg thr pro thr ala asp arg leu gin arg ile 
781/261 811/271 

ACC AAG AAC TCG GAG GTC TCT ACG GTA TGG ACC TGG CCG GAC AAG CCC GGC GTG GCC GGG 
thr lys asn ser glu val ser thr val trp thr trp pro asp lys pro gly val ala gly 
841/281 871/291 

TGT GCC GCG ATG GAC GGC ACC GTG CTG GTC AAC CTG ATT AAT ACC AAA CTG ACG GTG GCG 
cys ala ala met asp gly thr val leu val asn leu ile asn thr lys leu thr val ala 
901/301 931/311 

GTC CGG CTC GCG CCG TCG ACC GGT GCG GTC ACC GGA GAA CCC GAC GTT GTC CGC AAA GAC 
val arg leu ala pro ser thr gly ala val thr gly glu pro aso val val arg lys asp 
961/321 991/331 

ACT CAT GCG CAT GCG TGG GCA TTA CGG ATG TCG CCG GAC GGC AnC GTC TGG GGA GCC ACC 
thr his ala his ala trp ala leu arg met ser pro asp gly asn val trp gly ala thr 
1021/341 1051/351 

GTC AAC AAG ACC GCC GGC GAC GCC GAG AAG CTC GAC GAT GTG GTG TTC CCG CTG TTC CCG 

val asn lys thr ala gly asp ala glu lys leu asp asp val val phe pro leu phe pro 

1081/361 1111/371 

CAG GGT GGC GGC TTC CCG CGC AAC AAC GAC GAC AAG ACC TGA 

gin gly gly gly phe pro arg asn asn asp asp lys thr OPA 



SEQ ID N° 39D 



FIGURE 39D 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



126/185 



ORF d'apr^s Cole et al., 1998 (Nature 393 537-544) et contenant Rv3006 
1/1 31/11 

TAA GGC CAT TTA GTG CCG AAT TGG GGA TTT GAG CGG CGC TTT CGC CAG ACA ATC CGC ACA 
OCH gly his leu val pro asn trp gly phe glu arg arg phe arg gin thr ile arg thr 
61/21 91/31 

TTG ACC CTG ACC AGC CCA CCA AAA GGC CCC AAT TGG GCC GCC ATG CCG ACA GTG CGC ACC 
leu thr leu thr ser pro pro lys gly pro asn trp ala ala met pro thr val arg thr 
121/41 151/51 

CCG GCA GGT GGC GGC GAT GCC CAC AAT GTC CGT AGC CTG TCG GTC ATG TGG ACA ACG CGG 
pro ala gly gly gly asp ala his asn val arg ser leu ser val met trp thr thr arg 
181/61 211/71 

TTG GTT CGA TCC GGA CTC GCC GCG CTG TGC GCG GCA GTG CTG GTA TCG AGC GGC TGC GCA 
leu val arg ser gly leu ala ala leu cys ala ala val leu val ser ser gly cys ala 
241/81 271/91 

CGG TTC AAC GAC GCT CAA TCT CAG CCG TTC ACC ACC GAA CCG GAG CTG CGG CCC CAA CCC 
arg phe asn asp ala gin ser gin pro phe thr thr glu pro glu leu arg pro gin pro 
301/101 331/111 

AGC TCG ACA CCT CCC CCC CCG CCG CCG CTG CCG CCG GTT CCC TTT CCC AAG GAA TGT CCG 
ser ser thr pro pro pro pro pro pro leu pro pro val pro phe pro lys glu cys pro 
361/121 391/131 

GCG CCG GGC GTG ATG CAA GGC TGC CTT GAG AGC ACC AGC GGC TTG ATC ATG GGC ATC GAC 
ala pro gly val met gin gly cys leu glu ser thr ser gly leu ile met gly ile asp 
421/141 451/151 

AGC AAG ACC GCA CTG GTC GCC GAG CGC ATC ACC GGT GCC GTC GAG GAG ATC TCT ATC AGC 
ser lys thr ala leu val ala glu arg ile thr gly ala val glu glu ile ser ile ser 
481/161 511/171 

GCC GAG CCG AAG GTA AAG ACG GTC ATC CCC GTG GAT CCT GCC GGT GAC GGT GGC TTG ATG 
ala glu pro lys val lys thr val ile pro val asp pro ala gly asp gly gly leu met 
541/181 571/191 

GAC ATT GTG CTG TCG CCC ACC TAC TCG CAA GAC CGG CTG ATG TAG GCC TAC ATC AGC ACG 
asp ile val leu ser pro thr tyr ser gin asp arg leu met tyr ala tyr ile ser thr 
601/201 631/211 

CCC ACC GAC AAC CGG GTG GTG CGA GTG GCC GAC GGC GAC ATC CCC AAG GAC ATC CTG ACC 
pro thr asp asn arg val val arg val ala asp gly asp ile pro lys asp ile leu thr 
661/221 691/231 

GGC ATC CCC AAA GGT GCT GCC GGT AAC ACC GGG GCG CTG ATC TTC ACC AGT CCC ACC ACG 
gly ile pro lys gly ala ala gly asn thr gly ala leu ile phe thr ser pro thr thr 
721/241 751/251 

CTG GTC GTG ATG ACC GGG GAT GCT GGC GAC CCG GCG TTG GCC GCC GAT CCC CAA TCG TTG 
leu val val met thr gly asp ala gly asp pro ala leu ala ala asp pro gin ser leu 
781/261 811/271 

GCC GGT AAG GTC CTG CGT ATC GAA CAG CCC ACC ACC ATC GGC CAG ACG CCG CCG ACG ACG 
ala gly lys val leu arg ile glu gin pro thr thr ile gly gin thr pro pro thr thr 
841/281 871/291 

GCG CTG TCT GGC ATC GGC TCC GGC GGC GGC TTG TGC ATC GAT CCG GTC GAC GGC TCG CTA 
ala leu ser gly ile gly ser gly gly gly leu cys ile asp pro val asp gly ser leu 
901/301 931/311 

TAT GTC GCC GAC CGC ACG CCA ACG GCG GAC CGA TTG CAG CGC ATC ACC AAG AAC TCG GAG 
tyr val ala asp arg thr pro thr ala asp arg leu gin arg ile thr lys asn ser glu 



SEQ ID N° 39F 
FIGURE 39F 



FEUILLE DE REM PLACEMENT (REGLE 26) 



WO 99/09186 



PCT7FR98/01813 



127/185 



961/321 
















991/331 














GTC TCT ACG 


GTA 


TGG 


ACC 


TGG 


CCG 


GAC 


AAG 


CCC GGC GTG GCC 


GGG 






rrr 






val ser thr 


val 


trp 


thr 


trp 


pro 


asp lys 


pro gly val ala gly 


y 


ClXCl 


ala 
aid 


mot" 


asp 


1021/341 
















IUjI/ OOl 














GGC ACC GTG 


CTG 


GTC 


AAC 


CTG 


ATT 


AAT 


Apr 


AAA PTfZ &rr: PTC 


era 






PTP 




cm 


gly thr val 


leu 


val 


asn 


leu 


ile 


asn 


thr 


lys leu thr val 


ala 


Vfl J. 


arg 


leu 


ala 


pro 


1081/361 
















1111/371 










TCG ACC GGT 


GCG 


GTC 


ACC 


GGA 


GAA 


CCC 


GAC 


GTT GTC CGC AAA 


GAC 


APT 


CAT 


GCG 


CAT 


GCG 


ser thr gly ala val 


thr gly glu 


pro 


asp 


val val arg lys 


asp 


thr 


his 


ala 


his 


ala 


1141/381 
















1171/391 














TGG GCA TTA 


CGG 


ATG 


TCG 


CCG 


GAC 


GGC 


AAC 


GTC TGG GGA GCC 


ACC 


GTC 


AAC 


AAG 


ACC 


GCC 


trp ala leu 


arg 


met 


ser 


pro 


asp 


gly 


asn 


val trp gly ala 


thr 


val 


asn 


lys 


thr 


ala 


1201/401 
















1231/411 














GGC GAC GCC 


GAG 


AAG 


CTC 


GAC 


GAT 


GTG 


GTG 


TTC CCG CTG TTC 


CCG 


CAG 


GGT 


GGC 


GGC 


TTC 


gly asp ala 


glu 


lys 


leu 


asp 


asp 


val 


val 


phe pro leu phe 


pro 


gin 


gly gly 


gly phe 


1261/421 






























CCG CGC AAC 


AAC 


GAC 


GAC 


AAG 


ACC 


TGA 


















pro arg asn 


asn 


asp 


asp 


lys 


thr 


OPA 




























SEQ 


ID 


N° 


39F (suite) 















FIGURE 39F (suite) 



1/1 


















31/11 


















GAA GGC 


CTT 


GTT 


GAG 


CCG 


GCG 


CAC 


GAA 


AAC 


GAT CGT 


TGT 


GTG 


TAC 


ATT 


GGT 


GTG 


TAT 


GGC 


glu gly 
61/21 


leu 


yal 


glu pro 


ala 


his 


glu 


asn 


asp arg 
91/31 


cys 


val 


tyr 


ile 


gly 


val 


tyr 


gly 


TCG GTT 


GAA 


CGT 


GTA 


TGT 


GCC 


CGA 


CGA 


ATT 


GGC GGA 


GCG 


CGC 


CAG 


GGC 


GCG 


GGG 


CTT 


GAA 


ser val 
121/41 


glu 


arg 


val 


cys 


ala 


arg 


arg 


ile 


gly gly 
151/51 


ala 


arg gin 


gly 


ala 


gly leu 


glu 


CGT CTC 


GGC 


GCT 


GAC 


TCA 


GGC 


CGC 


GAT 


CAG 


TGC CGA 


GTT 


GGA 


GAA 


CTC 


CGC 


AAC 


CGA 


TGC 


arg leu 
181/61 


gly ala 


asp 


ser 


gly 


arg 


asp 


gin 


cys arg 
211/71 


val 


gly glu 


leu 


arg 


asn 


arg 


cys 


GTG GCT 


TGA 


GGG 


GTT 


GGA 


ACC 


CAG 


AAG 


CAC 


CGG CGC 


TCG 


GCA 


TGA 


TGA 


CGT 


GCT 


GGG 


TGC 


val ala 
241/81 


OPA gly val 


gly thr gin 


lys 


his 


arg arg 
271/91 


ser 


ala 


OPA 


OPA 


arg 


ala gly cys 


GAT CGA 


TGC 


CGC 


TCG 


CGA 


TGA 


GTT 


CGA 


AGC 


GTG AGA 


GCA 


TCG 


CCC 


ACT 


TCG 


CCG 


CCG 


GAG 


asp arg 
301/101 


cys 


arg 


ser 


arg 


OPA 


val 


arg 


ser 


val arg 
331/111 


ala 


ser 


pro 


thr 


ser 


pro 


pro 


glu 


CAG GTG 


GTC 


GTC 


GAC 


GCG 


AGT 


GCC 


ATG 


GTG 


GAT C 


















gin val 


val 


val 


asp 


ala 


ser 


ala 


met 


val 


asp 



















SEQ ID N° 4 OA 
FIGURE 40A 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



128/185 



1/1 

AAG GCC TTG TTG AGC CGG CGC 
lys ala leu leu ser arg arg 
61/21 

CGG TTG AAC GTG TAT GTG CCC 
arg leu asn val tyr val pro 
121/41 

GTC TCG GCG CTG ACT CAG GCC 
val ser ala leu thr gin ala 
181/61 

TGG CTT GAG GGG TTG GAA CCC 
trp leu glu gly leu glu pro 
241/81 

ATC GAT GCC GCT CGC GAT GAG 
ile asp ala ala arg asp glu 
301/101 

AGG TGG TCG TCG ACG CGA GTG 
arg trp ser ser thr arg val 









Ol /"II 

31/11 




ACG 


AAA 


ACG 


ATC GTT 


GTG 


thr 


lys 


thr 


ile val 


val 








y i/ oi 




GAC 


GAA 


TTG 


GCG GAG 


CGC 


asp glu 


leu 


ala glu 


arg 








ID 1/ Dl 




GCG 


ATC 


AGT 


GCC GAG 


TTG 


ala 


ile 


ser 


ala glu 


leu 








£ X X / 1 J. 




AGA AGC 


ACC 


GGC GCT 


CGG 


arg 


ser 


thr 


gly ala 


arg 








271/91 




TTC 


GAA 


GCG 


TGA GAG 


CAT 


phe 


glu 


ala 


OPA glu 


his 








331/111 




CCA 


TGG 


TGG 


ATC 




pro 


trp 


trp 


ile 





SEQ ID N° 40B 
FIGURE 40B 



TGT ACA TTG GTG TGT ATG GCT 
cys thr leu val cys met ala 

GCC AGG GCG CGG GGC TTG AAC 
ala arg ala arg gly leu asn 

GAG AAC TCC GCA ACC GAT GCG 
glu asn ser ala thr asp ala 

CAT GAT GAC GTG CTG GGT GCG 
his asp asp val leu gly ala 

CGC CCA CTT CGC CGC CGG AGC 
arg pro leu arg arg arg ser 



1/1 

AGG CCT TGT TGA GCC GGC GCA 
arg pro cys t OPA ala gly ala 
61/21 

GGT TGA ACG TGT ATG TGC CCG 
gly OPA thr cys met cys pro 
121/41 

TCT CGG CGC TGA CTC AGG CCG 
ser arg arg OPA leu arg pro 
181/61 

GGC TTG AGG GGT TGG AAC CCA 
gly leu arg gly trp asn pro 
241/81 

TCG ATG CCG CTC GCG ATG AGT 
ser met pro leu ala met ser 
301/101 

GGT GGT CGT CGA CGC GAG TGC 
gly gly arg arg arg glu cys 









31/11 




CGA 


AAA 


CGA 


TCG TTG 


TGT 


arg lys 


arg 


ser leu 


cys 








91/31 




ACG 


AAT 


TGG 


CGG AGC 


GCG 


thr 


asn 


trp 


arg ser 


ala 








151/51 




CGA 


TCA 


GTG 


CCG AGT 


TGG 


arg 


ser 


val 


pro ser 


trp 








211/71 




GAA 


GCA 


CCG 


GCG CTC 


GGC 


glu 


ala 


pro 


ala leu 


gly 








271/91 




TCG 


AAG 


CGT 


GAG AGC 


ATC 


ser 


lys 


arg 


glu ser 


ile 


CAT 


GGT 


GGA 


TC 




his 


gly 


gly 







SEQ ID N° 40C 
FIGURE 40C 



GTA CAT TGG TGT GTA TGG CTC 
val his trp cys val trp leu 

CCA GGG CGC GGG GCT TGA ACG 
pro gly arg gly ala OPA thr 

AGA ACT CCG CAA CCG ATG CGT 
arg thr pro gin pro met arg 

ATG ATG ACG TGC TGG GTG CGA 
met met thr cys trp val arg 

GCC CAC TTC GCC GCC GGA GCA 
ala his phe ala ala gly ala 



FEU1LLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



129/185 



Sequence codante Rv0549c predite par 
contenant seq40A 



1/1 

1/1 


















gtg aga 


gca 


teg 


ccc 


act 


teg 


ccg 


ccg 


gag 


val arg 


ala 


ser 


pro 


tnr 


ser 


pro 


pro 


gxu 


61/21 


















gat eta 


ctg 


get 


cgc 


act 


age 


gac 


egg 


tgc 


asp leu 


leu 


ala 


arg 


tnr 


ser 


asp 


arg 


cys 


121/41 


















gcg atg 


cac 


gcg 


ccg 


gcg 


cac 


ttc 


gat 


gca 


ala met 


his 


ala 


pro 


aia 


his 


phe 


asp 


aid 


181/61 


















cgc gec 


ggc 


gca 


etc 


acc 


g&x 


gec 


t* a 


gtc 


arg ala 


gly ala 


leu 


thr 


val 


ala 


tyr 


val 


241/81 


















ccg gtg 


act 


cga 


cac 


ggt 


ctt 


teg 


teg 


ctg 


pro val 


thr 


arg 


his 


gly 


leu 


ser 


ser 


leu 


301/101 


















etc cgc 


ctg 


acc 


gat 


gec 


etc 


tac 


gtc 


gag 


leu arg 


leu 


thr 


asp 


ala 


leu 


tyr 


val" 


glu 


361/121 


















acc acc 


gac 


gaa 


aga 


ttg 


gca 


cgc 


gee 


tgg 


thr thr 


asp 


glu 


arg 


leu 


ala 


arg 


ala 


trp 



et al., 1998 (Nature 393: 537-544) et 



31/11 

cag gtg gtc gtc gac gcg agt gec atg gtg 
gin val val val asp ala ser ala met val 
91/31 

tct gcg gtg cgc gcg egg ctg get egg acc 
ser ala val arg ala arg leu ala arg thr 
151/51 

gag gtg ttg teg gcg ctg ggg cgc atg cag 
glu val leu ser ala leu gly arg met gin 
211/71 

gat gcg gca ctg gag gag ttg cga cag gtg 
asp ala ala leu glu glu leu arg gin val 
271/91 

ctt get gga gcg tgg teg cgc cgc gac acc 
leu ala gly ala trp ser arg arg asp thr 

331/111 

ctg gec gaa acg gca ggt ctg gtg ttg ttg 
leu ala glu thr ala gly leu val leu leu 
391/131 

ccc teg get cac gee ate ggc tga 
pro ser ala his ala ile gly OPA 



SEQ ID N° 40D 



FIGURE 40D 



ORF d'apres Cole et al . , 1998 (Nature 393:537-544) et contenant Rv0549c 
1/1 31/11 

tga gtt cga age gtg aga gca teg ccc act teg ccg ccg gag cag gtg gtc gtc gac gcg 
OPA val arg ser val arg ala ser pro thr ser pro pro glu gin val val val asp ala 
61/21 91/31 

agt gec atg gtg gat eta ctg get cgc act age gat egg tgc tct gcg gtg cgc gcg egg 
ser ala met val asp leu leu ala arg thr ser asp arg cys ser ala val arg ala arg 
121/41 151/51 

ctg get egg acc gcg atg cac gcg ccg gcg cac ttc gat gca gag gtg ttg teg gcg ctg 
leu ala arg thr ala met his ala pro ala his phe asp ala glu val leu ser ala leu 
181/61 211/71 

ggg cgc atg cag cgc gee ggc gca etc acc gtt gee tat gtc gat gcg gca ctg gag gag 
gly arg met gin arg ala gly ala leu thr val ala tyr val asp ala ala leu glu glu 
241/81 271/91 

ttg cga cag gtg ccg gtg act cga cac ggt ctt teg teg ctg ctt get gga gcg tgg teg 
leu arg gin val pro val thr arg his gly leu ser ser leu leu ala gly ala trp ser 
301/101 331/111 

cgc cgc gac acc etc cgc ctg acc gat gec etc tac gtc gag ctg gec gaa acg gca ggt 
arg arg asp thr leu arg leu thr asp ala leu tyr val glu leu ala glu thr ala gly 
361/121 391/131 

ctg gtg ttg ttg acc acc gac gaa aga ttg gca cgc gec tgg ccc teg get cac gec ate 
leu val leu leu thr thr asp glu arg leu ala arg ala trp pro ser aia his ala ile 
421/141 
ggc tga 
gly OPA 

SEQ ID N° 40F 
FEUILLE DE REM^gg^^REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



130/185 



1/1 

CCT GGC CGG GAC GCC TAC GTG 
pro gly arg asp ala tyr val 
61/21 

AGC GCC AAA ACG ATC AGC CCT 
ser ala lys thr ile ser pro 
121/41 

CGT CGT GAC CGT GCT GTC ACC 
arg arg asp arg ala val thr 
181/61 

GGT GTG TTG CGG AGG AGG TGT 
gly val leu arg arg arg cys 
241/81 

GCC TTG CGG GAC TGG GCA CAC 
ala leu arg asp trp ala his 













TAG 






fc>L 1 ACjC 


ALA 


T\ MO 

AMd 


pro 


aia 


ala ser 


cnr 








31/ O 1 








Aw\ 




rap 


ser 




thr 


p\r c {* 1 n 

^•y o y ±. a 


hi q 








151/51 




ACG 


TCT 


GGT 


TAG GCT 


CGG 


thr 


ser 


gly 


AMB ala 


arg 








211/71 




GTT 


GTA 


GTG 


GGG ACG 


GCG 


val 


val 


val 


gly thr 


ala 








271/91 




GCC 


GTC 


GTC 


AGC GAT 


C 


ala 


val 


val 


ser asp 





SEQ ID N° 41A 
FIGURE 41A 



GGA TAG CCA TTG TTG TGC GGT 
gly AMB pro leu leu cys gly 

CCG CCT TGG CCG GGA GAG CGG 
pro pro trp pro gly glu arg 

GGC GCG GGC TGG CGC GGA GGA 
gly ala gly trp arg gly gly 

GAT CGG CCG TTG GAC GCC TCG 
asp arg pro leu asp ala ser 



1/1 

CTG GCC GGG ACG CCT 
leu ala gly thr pro 
61/21 

GCG CCA AAA CGA TCA 
ala pro lys arg ser 
121/41 

GTC GTG ACC GTG CTG 
val val thr val leu 
181/61 

GTG TGT TGC GGA GGA 
val cys cys gly gly 
241/81 

CCT TGC GGG ACT GGG 
pro cys gly thr gly 



ACG TGT AGC CCG CGG 
thr cys ser pro arg 

GCC CTT CGC GGA CAT 
ala leu arg gly his 

TCA CCA CGT CTG GTT 
ser pro arg leu val 

GGT GTG TTG TAG TGG 
gly val leu AMB trp 

CAC ACG CCG TCG TCA 
his thr pro ser ser 



31/11 

CTA GCA CAG GAT AGC 
leu ala gin asp ser 
91/31 

GTC AGC ACC CGC CTT 
val ser thr arg leu 
151/51 

AGG CTC GGG GCG CGG 
arg leu gly ala arg 
211/71 

GGA CGG CGG ATC GGC 
gly arg arg ile gly 
271/91 
GCG ATC 
ala ile 



CAT TGT TGT GCG GTA 
his cys cys ala val 

GGC CGG GAG AGC GGC 
gly arg glu ser gly 

GCT GGC GCG GAG GAG 
ala gly ala glu glu 

CGT TGG ACG CCT CGG 
arg trp thr pro arg 



SEQ ID N° 41B 



FIGURE 41B 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



131/185 



1/1 








TGG CCG 


GGA 


CGC 


CTA 


trp pro 


gly 


arg 


leu 


61/21 








CGC CAA 


AAC 


GAT 


CAG 


arg gin 


asn 


asp 


gin 


121/41 








TCG TGA 


CCG 


TGC 


TGT 


ser OPA 


pro 


cys 


cys 


181/61 








TGT GTT 


GCG 


GAG 


GAG 


cys val 


ala 


glu 


glu 


241/81 








CTT GCG 


GGA 


CTG 


GGC 


leu ala 


gly 


leu 


gly 



CGT GTA GCC CGC GGC 
arg val ala arg gly 

CCC TTC GCG GAC ATG 
pro phe ala asp met 

CAC CAC GTC TGG TTA 
his his val trp leu 

GTG TGT TGT AGT GGG 
val cys cys ser gly 

ACA CGC CGT CGT CAG 
thr arg arg arg gin 



31/11 

TAG CAC AGG ATA GCC 
AMB his arg ile ala 
91/31 

TCA GCA CCC GCC TTG 
ser ala pro ala leu 
151/51 

GGC TCG GGG CGC GGG 
gly ser gly arg gly 
211/71 

GAC GGC GGA TCG GCC 

asp gly gly ser ala 

271/91 

CGA TC 

arg 



ATT GTT GTG CGG TAG 
ile val val arg AMB 

GCC GGG AGA GCG GCG 
ala gly arg ala ala 

CTG GCG CGG AGG AGG 
leu ala arg arg arg 

GTT GGA CGC CTC GGC 
val gly arg leu gly 



SEQ ID N° 41C 



FIGURE 41C 



Sequence codante Rv2975c predite par Cole et al, 1998 (Nature 393: 537-544) et 
contenant seq41A 

1/1 31/11 

gtg ggg acg gcg gat egg ccg ttg gac gec teg gec ttg egg gac tgg gca cac gec gtc 
val gly thr ala asp, arg pro leu asp ala ser ala leu arg asp trp ala his ala val 
61/21 91/31 

gtc age gat ctg ate etc cac ate gac gag ate aac egg etc aat gtg ttc ccg gtc get 
val ser asp leu ile leu his ile asp glu ile asn arg leu asn val phe pro val ala 
121/41 151/51 

gac tec gat ace ggc gtc aac atg ctg ttc ace atg cgt gee gcg gtc gta gaa get gat 
asp ser asp thr gly val asn met leu phe thr met arg ala ala val val glu ala asp 
181/61 211/71 

ttg cac gcg aat teg cag get gac gee gaa gac gtg gcg egg gtt gcg gec get etc gcg 
leu his ala asn ser gin ala asp ala glu asp val ala arg val ala ala ala leu ala 
241/81 

gee ggc gcg cgt tga 
ala gly ala arg OPA 
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ORF d'apres Cole et al, 1998 (Nature 393: 537-544) et contenant Rv2975c 



1 /I 
1/ x 


















Ol/ IX 


















tag get 


egg 


ggc 


gcg 


ggc 


tgg 


cgc 


gga 




ggt gtg 


z tig 


egg 


agg 


agg 


tgt 


gtt 


gta 


gtg 


nun ala 

amd a j. a 


arg 


gly 


ala 


gly trp 


arg 


gly 


gly 


gly val 


leu 


arg 


arg 


arg 


cys 


vai 


vaj. 


vai 


Dl/ ^1 


















31/ Ji 


















ggg acg 


gcg 


gat 


egg 


ccg 


ttg 


gac 


gee 




y l. uy 


egg 


gac 


tgg 


gca 


cac 


gec 


gtc 


gtc 


gly thr 


ala 


asp 


arg 


pro 


leu 


asp 


ala 


ser 


ala leu 


arg 


asp 


trp 


ala 


his 


ala 


val 


val 


121/41 


















151/51 


















age gat 


ctg 


ate 


etc 


cac 


ate 


gac 


gag 


ate 


aac egg 


etc 


aat 


gtg 


ttc 


ccg 


gtc 


get 


gac 


ser asp 


leu 


ile 


leu 


his 


ile 


asp glu 


ile 


asn arg 


leu 


asn 


val 


phe 


pro 


val 


ala 


asp 


181/61 


















211/71 


















tec gat 


ace 


ggc 


gtc 


aac 


atg 


ctg 


ttc 


ace 


atg cgt 


gee 


gcg 


gtc 


gta 


gaa 


get 


gat 


ttg 


ser asp 


thr 


gly val 


asn 


met 


leu phe 


thr 


met arg 


ala 


ala 


val 


val 


glu 


ala 


asp 


leu 


241/81 


















271/91 


















cac gcg 


aat 


teg 


cag 


get 


gac 


gec 


gaa 


gac 


gtg gcg 


egg 


gtt 


gcg 


gec 


get 


etc 


gcg 


gec 


his ala 


asn 


ser 


gin 


ala 


asp 


ala 


glu 


asp 


val ala 


arg 


val 


ala 


ala 


ala 


leu 


ala 


ala 



301/101 

ggc gcg cgt tga 
gly ala arg OPA 



SEQ ID N° 41F 
FIGURE 41F 



sequence Rv 2974C predite par Cole et'al. (Nature 393:537-544) et pouvant etre 
dans la meme phase de lecture que Seq41D. Le sequencage de cette region fait 
apparaitre dans un cas sur trois une deletion de deux nucleotides mettant en 
phase bserve dans 



1/1 

ttg aac gga get 
leu asn gly ala 
61/21 

gag gtg ace gcg 
glu val thr ala 
121/41 

gec etc ggg gee 
ala leu gly ala 
181/61 

gag gtg ccg gga 
glu val pro gly 
241/81 

gcg cac gag ggg 
ala his glu gly 
301/101 

gaa aag acc ccc 
glu lys thr pro 



cgc ggc aac tec 
arg gly asn ser 

act gcg gee gee 
thr ala ala ala 

gcg ttg tgg cgc 
ala leu trp arg 

act ate gtc teg 
thr ile val ser 

ttg gec ggt gcg 
leu ala gly ala 

gaa cag ctt gac 
glu gin leu asp 



31/11 



ggc 


gtg 


ate ctg 


gly 


val 


ile leu 






91/31 


gee 


tct 


ggc gcg 


ala 


ser 


gly ala 






151/51 


ggc 


gtc 


gag ttg 


gly 


val 


glu leu 






211/71 


gtg 


ctg 


egg gec 


val 


leu 


arg ala 






271/91 


gtc 


acc 


gee gec 


val 


thr 


ala ala 






331/111 


gtg 


etc 


gec gat 


val 


leu 


ala asp 



tec cag ate ctg 
ser gin ile leu 

gta ttg egg gcg 
val leu arg ala 

gtc gtc gcg teg 
val val ala ser 

gec gee gga gee 
ala ala gly ala 

ggt gac gcg gcg 
gly asp ala ala 

gcg ggc gcg gtg 
ala gly ala val 



cgc ggg ate gca 
arg gly ile ala 

gtc gac gec aac 
val asp ala asn 

atg ggt ggc gtg 
met gly gly val 

gtc gac cag tgc 
val asp gin cys 

gtc ate gcg ctg 
val ile ala leu 

gac gec ggc gga 
asp ala gly gly 
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361/121 

egg ggc ctg ctg gtt ctg ctg gac gcg ttg 
arg gly leu leu val leu leu asp ala leu 
421/141 

egg gcg gtc tac gaa ccc teg ccg cgc gcg 
arg ala val tyr glu pro ser pro arg ala 
481/161 

gee ccg caa ttc gag gtg atg tat ctg ttg 
ala pro gin phe glu val met tyr leu leu 
541/181 

ttg egg gat cga etc aag gaa ttg ggt gag 
leu arg asp arg leu lys glu leu gly glu 
601/201 

age tac tec gta cac gtc cac ace gac gac 
ser tyr ser val his val his thr asp asp 
661/221 

gtg ggg cga gtt age egg ate gtg ate teg 
val gly arg val ser arg ile val ile ser 
721/241 

gee ggt ggc tgg acg egg ggc cgc gec gtg 
ala gly gly trp thr arg gly arg ala val 
781/261 

gag ctg ttc gec ggg gag ggc gec tgc gtg 
glu leu phe ala gly glu gly ala cys val 
841/281 

gee gec gat ate agt gec cac cag ctg gtg 
ala ala asp ile ser ala his gin leu val 
901/301 

gtg atg gtg ctg ccc aat ggc tat gtg gec 
val met val leu pro asn gly tyr val ala 
961/321 

gcg ate ggc tgg ggc gtc gac gtg gta ccc 
ala ile gly trp gly val asp val val pro 
1021/341 

gec gcg ctg gee gtg cat gac gcg gec cgc 
ala ala leu ala val his asp ala ala arg 
1081/361 

cgt gec gec ggt get tec egg cac gga teg 
arg ala ala gly ala ser arg his gly ser 
1141/381 

tgg gec ggt acc tgc aag ccg ggc gac ggt 
trp ala gly thr cys lys pro gly asp gly 
1201/401 

gtc gec gac gat gtc gee gcg gcg gec ate 
val ala asp asp val ala ala ala ala ile 
1261/421 

ggc gat ctg gtg acg gtg eta att ggc gec 
gly asp leu val thr val leu ile gly ala 
1321/441 

gaa egg cat gtg cac gac cac cat cca ggc 
glu arg his val his asp his his pro gly 
1381/461 

cgc ggc gac gcg ctg ctg ate ggg gtc gag 
arg gly asp ala leu leu ile gly val glu 



391/131 

cgc tec acc ate tgc ggg cag gca cct gee 
arg ser thr ile cys gly gin ala pro ala 
451/151 

ttg ccg acc gac acg get acc caa cgc ccc 
leu pro thr asp thr ala thr gin arg pro 
511/171 

gcg gta tgt gat get gca gcg gcg gac cag 
ala val cys asp ala ala ala ala asp gin 
571/191 

teg gtg gec ate gee get get ccg ccc gac 
ser val ala ile ala ala ala pro pro asp 
631/211 

gec ggt gec gec gtg gaa gec gga ttg gcg 
ala gly ala ala val glu ala gly leu ala 
691/231 

gcg etc ggt tec ggg acc age gga ttg ccg 
ala leu gly ser gly thr ser gly leu pro 
751/251 

ctg gcg gtc gtc gac ggc gac ggt gec gee 
leu ala val val asp gly asp gly ala ala 
8117271 

ctg cga ccg ggt cca gac gec gtg aca ccg 
leu arg pro gly pro asp ala val thr pro 
871/291 

egg gec gtg gta gac acc ggc gee gcg cac 
arg ala val val asp thr gly ala ala his 
931/311 

gec gaa gaa ctg gtg gec ggg tgt acc gcg 
ala glu glu leu val ala gly cys thr ala 
991/331 

gtg ccg acc gga teg atg gtg cag ggg ttg 
val pro thr gly ser met val gin gly leu 
1051/351 

cag gec gtc gac gac ggc tac age atg gec 
gin ala val asp asp gly tyr ser met ala 
1111/371 

gtg cgc att gec acc caa aag gcg ctg acc 
val arg ile ala thr gin lys ala leu thr 
1171/391 

ctg ggt ate gcg ggc gac gag gtg ctg ate 
leu gly ile ala gly asp glu val leu ile 
1231/411 

ggt ctg gtc gac ctg ttg ttg gca teg gga 
gly leu val asp leu leu leu ala ser gly 
1291/431 

ggc gta acc gaa gac gtg get gtc gtc ctg 
gly val thr glu asp val ala val val leu 
1351/451 

acc gag ctg gtc tec tac cgc acc gga cac 
thr glu leu val ser tyr arg thr gly his 
1411/471 
tag 
AMB 
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FIGURE 41S (suite) 
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PCI7FR98/01813 



Seq41T comprenant seq 41F et seq 41S 

1/1 31/11 

tta ggc teg ggg cgc ggg ctg gcg egg agg agg tgt gtt gcg gag gag gtg tgt tgt agt 
leu gly ser gly arg gly leu ala arg arg arg cy3 val ala glu glu val cys cys ser 
AMB ala arg gly ala gly trp arg gly gly gly val leu arg arg arg cys val val val 

arg leu gly ala arg ala gly ala glu glu val cys cys gly gly gly val leu AMB trp 
61/21 91/31 

ggg gac ggc gga teg gec gtt gga cgc etc ggc ctt gcg gga ctg ggc aca cgc cgt cgt 
gly asp gly gly ser ala val gly arg leu gly leu ala gly leu gly thr arg arg arg 
gly thr ala asp arg pro leu asp ala ser ala leu arg asp trp ala his ala val val 
gly arg arg ile gly arg trp thr pro arg pro cys gly thr gly his thr pro ser ser 
121/41 151/51 

cag cga tct gat cct cca cat cga cga gat caa ccg get caa tgt gtt ccc ggt cgc tga 
gin arg ser asp pro pro his arg arg asp gin pro ala gin cys val pro gly arg OPA 
ser asp leu ile leu his ile asp glu ile asn arg leu asn val phe pro val ala asp 
ala ile OPA ser ser thr ser thr arg ser thr gly ser met cys ser arg ser leu thr 
181/61 211/71 

etc cga tac egg cgt caa cat get gtt cac cat gcg tgc cgc ggt cgt aga age tga ttt 
leu arg tyr arg arg gin his ala val his his ala cys arg gly arg arg ser OPA phe 
ser asp thr gly val asn met leu phe thr met arg ala ala val val glu ala asp leu 
pro ile pro ala ser thr cys cys ser pro cys val pro arg ser AMB lys leu ile cys 
241/81 271/91 

gca cgc gaa ttc gca ggc tga cgc cga aga cgt ggc gcg ggt tgc ggc cgc tct cgc ggc 
ala arg glu phe ala gly OPA arg arg arg arg gly ala gly cy3 gly arg ser arg gly 
his ala asn ser gin ala asp ala glu asp val ala arg val ala ala ala leu ala ala 

thr arg ile arg arg leu thr pro lys thr trp arg gly leu arg pro leu ser arg pro 
301/101 331/111 

egg cgc gcg ttg aac gga get cgc ggc aac tec ggc gtg ate ctg tec cag ate ctg cgc 
arg arg ala leu asn gly ala arg gly asn ser gly val ile leu ser gin ile leu arg 
gly ala arg OPA thr glu leu ala ala thr pro ala OPA ser cys pro arg ser cys ala 
ala arg val glu arg ser ser arg gin leu arg arg asp pro val pro asp pro ala arg 
361/121 391/131 

ggg ate gca gag gtg ace gcg act gcg gec gee gec tct ggc gcg gta ttg egg gcg gtc 
gly ile ala glu val thr ala thr ala ala ala ala ser gly ala val leu arg ala val 
gly ser gin arg OPA pro arg leu arg pro pro pro leu ala arg tyr cys gly arg ser 
asp arg arg gly asp arg asp cys gly arg arg leu tro arg gly ile ala gly gly arg 
421/141 451/151 

gac gee aac gee etc ggg gee gcg ttg tgg cgc ggc gtc gag ttg gtc gtc gcg teg atg 
asp ala asn ala leu gly ala ala leu trp arg gly val glu leu val val ala ser met 
thr pro thr pro ser gly pro arg cys gly ala ala ser ser trp ser ser arg arg trp 
arg gin arg pro arg gly arg val val ala arg arg arg val gly arg arg val asp gly 
481/161 511/171 

ggt ggc gtg gag gtg ccg gga act ate gtc teg gtg ctg egg gec gee gec gga gec gtc 
gly gly val glu val pro gly thr ile val ser val leu arg ala ala ala gly ala val 
val ala trp arg cys arg glu leu ser ser arg cys cys gly pro pro pro glu pro ser 

trp arg gly gly ala gly asn tyr arg leu gly ala ala gly arg arg arg ser arg arg 
541/181 571/191 

gac cag tgc gcg cac gag ggg ttg gee ggt gcg gtc acc gec gee ggt gac gcg gcg gtc 
asp gin cys ala his glu gly leu ala gly ala val thr ala ala gly asp ala ala val 
thr ser ala arg thr arg gly trp pro val arg ser pro pro pro val thr arg arg ser 
pro val arg ala arg gly val gly arg cys gly his arg arg arg OPA arg gly gly his 
601/201 631/211 

ate gcg ctg gaa aag acc ccc gaa cag ctt gac gtg etc gec gat gcg ggc gcg gtg gac 
ile ala leu glu lys thr pro glu gin leu asp val leu ala asp ala gly ala val asp 
ser arg trp lys arg pro pro asn ser leu thr cys ser pro met arg ala arg trp thr 
arg ala gly lys asp pro arg thr ala OPA arg ala arg arg cys gly arg gly gly arg 
661/221 691/231 

gec ggc gga egg ggc ctg ctg gtt ctg ctg gac gcg ttg cgc tec acc ate tgc ggg cag 
ala gly gly arg gly leu leu val leu leu asp ala leu arg ser thr ile cys gly gin 
pro ala asp gly ala cys trp phe cys trp thr arg cys ala pro pro ser ala gly arg 
arg arg thr gly pro ala gly ser ala gly arg val ala leu his his leu arg ala gly 
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721/241 751/251 

gca cct gcc egg gcg gtc tac gaa ccc teg ccg cgc gcg ttg ccg acc gac acg get acc 
ala pro ala arg ala val tyr glu pro ser pro arg ala leu pro thr asp thr ala thr 
his leu pro gly arg ser thr asn pro arg arg ala arg cys arg pro thr arg leu pro 
„^= y3 P ro 9^ leu "9 thr leu ala ala arg val ala asp arg his gly tyr pro 
781/261 811/271 

caa cgc ccc gcc ccg caa ttc gag gtg atg tat ctg ttg gcg gta tgt gat get gca gcg 
gin arg pro ala pro gin phe glu val met tyr leu leu ala val cys asp ala ala ala 
asn ala pro pro arg asn ser arg OPA cys ile cys trp arg tyr val met leu gin arg 

fldX?" Pr ° " g glY " P Val 3er val 9^ 9ly met OPA cys cys ser gly 

841/281 871/291 

gcg gac cag ttg egg gat cga etc aag gaa ttg ggt gag teg gtg gcc ate gcc get get 
ala asp gin leu arg asp arg leu lys glu leu gly glu ser val ala ile ala ala ala 
arg thr ser cys gly ile asp ser arg asn trp val ser arg trp pro ser pro leu leu 

on?y^? r ° 9 y 3er thr gln gly Ue gly 0PA val his arg arg cys ser 

901/301 931/311 

ccg ccc gac age tac tec gta cac gtc cac acc gac gac gcc ggt gcc gcc gtg gaa gcc 
pro pro asp ser tyr ser val his val his thr asp asp a l a gly ala ala val glu ala 
arg pro thr ala thr pro tyr thr ser thr pro thr thr pro val pro pro trp lys pro 

QC a / a -, arg 9 u arg thr arg pro ^ arg arg "9 "3 c v s ar g giy «r arg 

961/321 991/331 

gga ttg gcg gtg ggg cga gtt age egg ate gtg ate teg gcg etc ggt tec ggg acc age 
gly leu ala val gly arg val ser arg ile val ile ser ala leu gly ser gly thr ser 
asp trp arg trp gly glu leu ala gly ser OPA ser arg arg ser val pro gly pro ala 

Tn^/^ y 9 y 9ly 313 S8f Pr ° 3SP 3rg d3p leu *ly ala at 9 P he «g «P gm arg 
1021/341 1051/351 

gga ttg ccg gcc ggt ggc tgg acg egg ggc cgc gcc gtg ctg gcg gtc gtc gac ggc gac 
gly leu pro ala gly gly trp thr arg gly arg ala val leu ala val val asp gly asp 
asp cys arg pro val ala gly arg gly ala ala pro cys trp arg ser ser thr ala thr 

inJjMSi* 9 y 3rg ttP l6U aSP ala gly PC ° arg arg ala ff 1 * 9ly arg arg arg arg arg 
1081/361 1111/371 

ggt gcc gcc gag ctg ttc gcc ggg gag ggc gcc tgc gtg ctg cga ccg ggt cca gac gcc 
gly ala ala glu leu phe ala gly glu gly ala cys val leu arg pro gly pro asp ala 
val pro pro ser cys ser pro gly arg ala pro ala cys cys asp arg val gin thr pro 

,i?K%2? 9 aCg aU Val arg atg 9ly gly arg leu ar * ala ala chr g^ a « arg arg arg 
1141/381 1171/391 

gtg aca ccg gcc gcc gat ate agt gcc cac cag ctg gtg egg gcc gtg gta gac acc ggc 
val thr pro ala ala asp ile ser ala his gin leu val arg ala val val asp thr gly 
OPA his arg pro pro ile ser val pro thr ser trp cys gly pro trp AMB thr pro ala 

,,my.m r 9 Y " g tyt 9ln CyS Pr ° Pr ° ala gly ala gly arg gly arg his arg arg 
1201/401 1231/411 

gcc gcg cac gtg atg gtg ctg ccc aat ggc tat gtg gcc gcc gaa gaa ctg gtg gcc ggg 
ala ala his val met val leu pro asn gly tyr val ala ala glu glu leu val ala all 
pro arg thr OPA trp cys cys pro met ala met trp pro pro lys asn trp trp pro gly 

^ gly ala alS gl[1 trp l6U CyS gly arg ar g «g thr gly gly arg val 
1261/421 1291/431 

tgt acc gcg gcg ate ggc tgg ggc gtc gac gtg gta ccc gtg ccg acc gga teg atg gtg 
cys thr ala ala ile gly trp gly val asp val val pro val pro thr gly ser met val 
val pro arg arg ser ala gly ala ser thr trp tyr pro cys arg pro asp arg trp cys 

i^w*!?* 9 Y ^ l6U 9ly " g arg arg gly Chr arg ala as P «g ile asP gly ala 
1321/441 1351/451 

cag ggg ttg gcc gcg ctg gcc gtg cat gac gcg gcc cgc cag gcc gtc gac gac ggc tac 
gin gly leu ala ala leu ala val his asp ala ala arg gin ala val asp asp gly ty 
arg gly trp pro arg- trp pro cys met thr arg pro ala arg pro ser thr thr ala thr 

i 9 7 arg 9ly ar9 Sla ° PA atg gly pr0 pro gly arg ar * «g arg leu gin 

1381/461 1411/471 

age atg gcc cgt gcc gcc ggt get tec egg cac gga teg gtg cgc att gcc acc caa aag 
ser met ala arg ala ala gly ala ser arg his gly ser val arg ile ala thr gin lys 
ala trp pro val pro pro val leu pro gly thr asp arg cys ala leu pro pro lys a -a 
his gly pro cys arg arg cys phe pro ala arg ile gly ala his cys his pro lys gly 
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1441/481 1471/491 

gcg ctg acc tgg gcc ggt acc tgc aag ccg ggc gac ggt ctg ggt ate gcg ggc gac gag 
ala leu thr trp ala gly thr cys lys pro gly asp gly leu gly ile ala gly asp glu 
arg OPA pro gly pro val pro ala ser arg ala thr val trp val ser arg ala thr arg 

ala asp leu gly arg tyr leu gin ala gly arg arg ser gly tyr arg gly arg arg gly 
1501/501 1531/511 

gtg ctg ate gtc gcc gac gat gtc gcc gcg gcg gcc ate ggt ctg gtc gac ctg ttg ttg 
val leu ile val ala asp asp val ala ala ala ala ile gly leu val asp leu leu leu 
cys OPA ser ser pro thr met ser pro arg arg pro ser val trp ser thr cys cys trp 

ala asp arg arg arg arg cys arg arg gly gly his arg ser gly arg pro val val gly 
1561/521 1591/531 

gca teg gga ggc gat ctg gtg acg gtg eta att ggc gcc ggc gta acc gaa gac gtg get 
ala ser gly gly asp leu val thr val leu ile gly ala gly val thr glu asp val ala 
his arg glu ala ile trp OPA arg cys OCH leu ala pro ala OCH pro lys thr trp leu 

ile gly arg arg ser gly asp gly ala asn trp arg arg arg asn arg arg arg gly cys 
1621/541 1651/551 

gtc gtc ctg gaa egg cat gtg cac gac cac cat cca ggc acc gag ctg gtc tec tac cgc 
val val leu glu arg his val his asp his his pro gly thr glu leu val ser tyr arg 
ser ser trp asn gly met cys thr thr thr ile gin ala pro ser trp ser pro thr ala 
arg pro gly thr ala cys ala arg pro pro ser arg his arg ala gly leu leu pro his 
1681/561 1711/571 
acc gga cac cgc ggc gac gcg ctg ctg ate ggg gtc gag tag 
thr gly his arg gly asp ala leu leu ile gly val glu AMB 
pro asp thr ala ala thr arg cys OPA ser gly ser ser 
arg thr pro arg arg arg ala ala asp arg gly arg val 
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1/1 














31/11 


















GCC GGT AAC 


GCC GCG 


TCC 


CAG 


TGC 


TAT 


CCG 


TCC GCC 


GGA 


CCG 


CCC 


GAA 


ACA 


TCA 


GCG 


GCG 


ala gly asn 


ala ala 


ser 


gin 


cys 


tyr 


pro 


ser ala 


gly pro pro 


glu 


thr 


ser 


ala 


ala 


61/21 














91/31 


















GGC GCC CCG 


GTC GGC 


CGC 


GGC 


CGG 


GCT 


CGA 


CCC GCT 


CCA 


CCT 


GGC 


CAT 


CAG 


CGA 


CCA 


GGT 


gly ala pro val gly 


arg 


gly 


arg 


ala 


arg 


pro ala 


pro 


pro 


gly 


his 


gin 


arg 


pro 


gly 


121/41 














151/51 


















TAT CGA GGT 


GGA AGC 


GGA 


CGG 


TGT 


TGG 


GAT 


GCA CGC 


CCA 


ACT 


TGC 


CGG 


CGA 


TCG 


CGG 


CGA 


tyr arg gly gly ser 


gly 


arg 


cys 


trp 


asp 


ala arg 


pro 


thr 


cys 


arg 


arg 


ser 


arg 


arg 


181/61 














211/71 


















TGC TCA TCG 


GAA CCC 


GCG 


ACG 


CAC 


ACA 


ATG 


CCC GCA 


GCA 


CCG 


CAC 


GAC 


GGC 


GCC 


CCA 


CCG 


cys ser ser 


glu pro 


ala 


thr 


his 


thr 


met 


pro ala 


ala 


pro 


his 


asp 


gly 


ala 


pro 


pro 


241/81 














271/91 


















GCT CTT GCA 


GTG ACC 


TGA 


TGA 


TGA 


CAC 


TCA 


CCC CCA 


TAA 


GGC 


TCG 


TCG 


GCT 


GCG 


CCT 


GAG 


ala leu ala 


val thr 


OPA 


OPA 


OPA 


his 


ser 


pro pro 


OCH gly 


ser 


ser 


ala 


ala 


pro 


glu 


301/101 














331/111 


















CAA TGC AGT 


AAG TTT 


ACA 


CAA 


ACG 


GAC 


TTG 


TAA AAA 


CCT 


GCG 


GAG 


GTG 


GGG 


TCT 


ATG 


GCC 


gin cys ser 


lys phe 


thr 


gin 


thr 


asp 


leu 


OCH lys 


pro 


ala 


glu 


val 


gly 


ser 


met 


ala 


361/121 














391/131 


















AAC AAA CGT 


GGC AAT 


GCC 


GGG 


CAG 


CCT 


CTG 


CCC TTG 


TCG 


GAT 


C 












asn lys arg 


gly asn 


ala 


gly 


gin 


pro 


leu 


pro leu 


ser 


asp 















SEQ ID N° 42A 



FIGURE 42A 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



137/185 



1/1 

CCG GTA ACG CCG CGT CCC AGT 
pro val thr pro arg pro ser 
61/21 

GCG CCC CGG TCG GCC GCG GCC 
ala pro arg ser ala ala ala 
121/41 

ATC GAG GTG GAA GCG GAC GGT 
ile glu val glu ala asp gly 
181/61 

GCT CAT CGG AAC CCG CGA CGC 
ala his arg asn pro arg arg 
241/81 

CTC TTG CAG TGA CCT GAT GAT 
leu leu gin OPA pro asp asp 
301/101 

AAT GCA GTA AGT TTA CAC AAA 
asn ala val ser leu his lys 
361/121 

ACA AAC GTG GCA ATG CCG GGC 
thr asn val ala met pro gly 









J 1/ 1 1 




GCT 


ATC 


CC 1 


CCC Clu 




ala 


ile 


arg 


pro pro 


asp 








31/ j1 




GGG 


CTC 


CzAC 


CIC 


CAC 


gly leu 


asp 


pro leu 


Kin 

nis 








101/ J 1 




GTT 


GGG 




CAC oLt, 


CAA 


val 


gly 


met 


his ala 


gin 








Oil / 1 1 

^11/ / 1 




ACA 


CAA 


i uc 


CCC CAC 


CAC 


thr gin 


cys 


pro yin 


his 








271/91 




GAC 


ACT 


CAC 


CCC CAT 


AAG 


asp 


thr 


his 


pro his 


lys 








331/111 




CGG 


ACT 


TGT 


AAA AAC 


CTG 


arg 


thr 


cys 


lys asn 


leu 








391/131 




AGC 


CTC 


TGC 


CCT TGT 


CGG 


ser 


leu 


cys 


pro cys 


arg 



SEQ ID N° 42B 
FIGURE 42B 



CGC 


CCG 


AAA 


CAT 


CAG CGG 


CGG 


arg 


pro 


lys 


his 


gin arg 


arg 


CTG 


GCC 


ATC 


AGC 


GAC CAG 


GTT 


leu 


ala 


ile 


ser 


asp gin 


val 


C 1 1 


GCC 


GGC 


GAT 


CCC CGC 


GAT 


leu 


ala gly asp 


arg gly 


asp 


CGC 


ACG 


ACG 


GCG 


CCC CAC 


CGG 


arg 


thr 


thr 


ala 


pro his 


arg 


GCT 


CGT 


CGG 


CTG 


CGC CTG 


AGC 


ala 


arg 


arg 


leu 


arg leu 


ser 


CGG 


AGG 


TGG 


GGT 


CTA TGG 


CCA 


arg 


arg 


trp gly 


leu trp 


pro 



ATC 
ile 



1/1 

CGG TAA CGC CGC GTC CCA GTG 
arg OCH arg arg val pro val 
61/21 

CGC CCC GGT CGG CCG CGG CCG 
arg pro gly arg pro arg pro 
121/41 

TCG AGG TGG AAG CGG ACG GTG 
ser arg trp lys arg thr val 
181/61 

CTC ATC GGA ACC CGC GAC GCA 
leu ile gly thr arg asp ala 
241/81 

TCT TGC AGT GAC CTG ATG ATG 
ser cys ser asp leu met met 
301/101 

ATG CAG TAA GTT TAC ACA AAC 
met gin OCH val tyr thr asn 
361/121 

CAA ACG TGG CAA TGC CGG GCA 
gin thr trp gin cys arg ala 









31/11 




CTA 


TCC 


GTC 


CGC CGG 


ACC 


leu 


ser 


val 


arg arg 


thr 








91/31 




GGC 


TCG 


ACC 


CGC TCC 


ACC 


gly 


ser 


thr 


arg ser 


thr 








151/51 




TTG 


GGA 


TGC 


ACG CCC 


AAC 


leu gly 


cys 


thr pro 


asn 








211/71 




CAC 


AAT 


GCC 


CGC AGC 


ACC 


his 


asn 


ala 


arg ser 


thr 








271/91 




ACA 


CTC 


ACC 


CCC ATA 


AGG 


thr 


leu 


thr 


pro ile 


arg 








331/111 




GGA 


CTT 


GTA 


AAA ACC 


TGC 


gly leu 


val 


lys thr 


cys 








391/131 




GCC 


TCT 


GCC 


CTT GTC 


GGA 


ala 


ser 


ala 


leu val 


gly 



GCC CGA AAC ATC AGC GGC GGG 
ala arg asn ile ser gly gly 

TGG CCA TCA GCG ACC AGG TTA 
trp pro ser ala thr arg leu 

TTG CCG GCG ATC GCG GCG ATG 
leu pro ala ile ala ala met 

GCA CGA CGG CGC CCC ACC GGC 
ala arg arg arg pro thr gly 

CTC GTC GGC TGC GCC TGA GCA 
leu val gly cys ala OPA ala 

GGA GGT GGG GTC TAT GGC CAA 
gly gly gly val tyr gly gin 

TC 



SEQ ID N° 42C 



FIGURE 42C 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



138/185 



Sequence codante Rv2622 predite par Cole et al., 1998 (Nature 393:537-544) et 
contenant seq42A: 

1/1 31/11 

atg gcc aac aaa cgt ggc aat gcc ggg cag cct ctg ccc ttg teg gat cga gac gac gac 
Met ala asn lys arg gly asn ala gly gin pro leu pro leu ser asp arg asp asp asp 
61/21 91/31 

cac atg cag ggg cac tgg ctg ctg gcc egg ctg ggc aag egg gtg ctg cgt ccc ggc ggc 
his met gin gly his trp leu leu ala arg leu gly lys arg val leu arg pro gly gly 
121/41 151/51 

gtc gaa etc acc egg aca ctg ctg gcc cgc gcc gag gtg ace gac gcc gac gtg etc gag 
val glu leu thr arg thr leu leu ala arg ala glu val thr asp ala asp val leu glu 
181/61 211/71 

ctg gca ccg ggc ctg ggc cgc acc gca gcc gaa ate ttg gcc cgc aac ccg egg teg tac 
leu ala pro gly leu gly arg thr ala ala glu ile leu ala arg asn pro arg ser tyr 
241/81 271/91 

gtg ggg gcg gag age gat ccc aac gcg gcc aac ctg gtc cga cac gtt etc gcc ggc cgc 
val gly ala glu ser asp pro asn ala ala asn leu val arg his val leu ala gly arg 
301/101 331/111 

ggc gac gtc egg gtc acc gac gcg gcc gat acc gga tta tec gac gcc age gcc gat gtc 
gly asp val arg val thr asp ala ala asp thr gly leu ser asp ala ser ala asp val 
361/121 391/131 

gtc ate ggc gag gcg atg ctg acc atg caa ggc aac gcg get aaa cac acg ate gtc gcc 
val ile gly glu ala met leu thr met gin gly asn ala ala lys his thr ile val ala 
421/141 451/151 

gag gcg gcg egg gtg ctg agg ccg ggt ggc cgc tac gcg att cac gaa eta gcg ctg gtg 
glu ala ala arg val leu arg pro gly gly arg tyr ala ile his glu leu ala leu val 
481/161 511/171 

ccg gac gac gtc gca gag cag gtc cgc acc gac ctg egg cag teg ctg gcc cgc gcg etc 
pro asp asp val ala glu gin val arg thr asp leu arg gin ser leu ala arg ala leu 
541/181 ' 571/191 

aag gtc aat gcg cgt ccg ctg acc gtt gcg gaa tgg teg cac etc tta gcg ggc cat gga 
lys val asn ala arg pro leu thr val ala glu trp ser his leu leu ala gly his gly 
601/201 631/211 

ctg gtc gtc gaa cac gtt gtc acc get tec atg gcg ttg tta caa ccg cga egg gtg ate 
leu val val glu his val val thr ala ser met ala leu leu gin pro arg arg val ile 
661/221 691/231 

get gac gaa ggc etc ctg ggt gcg ctg egg ttc gcc gga aac ctg etc ate cat cgt gcc 
ala asp glu gly leu leu gly ala leu arg phe ala gly asn leu leu ile his arg ala 
721/241 751/251 

gcg cgt egg cga gtc ctg ttg atg cgc cac aca ttc cgc agg cat cgt gaa cgc ttg aca 

ala arg arg arg val leu leu met arg his thr phe arg arg his arg glu arg leu thr 

781/261 811/271 

gcc gtc gcc att gtc gcg cac aaa ccg cac gtc gat teg tga 

ala val ala ile val ala his lys pro his val asp ser OPA 



SEQ ID N° 42D 



FIGURE 42D 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



139/185 



ORF d'apres Cole et al., 1998 (Nature 393:537-544) et contenant Rv2622 



1/1 

taa aaa cct 
OCH lys pro 
61/21 

ccc ttg teg 
pro leu ser 
121/41 
aag egg gtg 
lys arg val 
181/61 
gtg acc gac 
val thr asp 
241/81 
ttg gec cgc 
leu ala arg 
301/101 
gtc cga cac 
val arg his 
361/121 
tta tec gac 
leu ser asp 
421/141 
gcg get aaa 
ala ala lys 
481/161 
gcg att cac 
ala ile his 
541/181 
egg cag teg 
arg gin ser 
601/201 
teg cac etc 
ser his leu 
661/221 
ttg tta caa 
leu leu gin 
721/241 
gga aac ctg 
gly asn leu 
781/261 
cgc agg cat 
arg arg his 
841/281 
teg tga 
ser OPA 



gcg gag gtg 
ala glu val 

gat cga gac 
asp arg asp 

ctg cgt ccc 
leu arg pro 

gec gac gtg 
ala asp val 

aac ccg egg 
asn pro arg 

gtt etc gec 
val leu ala 

gec age gec 
ala ser ala 

cac acg ate 
his thr ile 

gaa eta gcg 
glu leu ala 

ctg gec cgc 
leu ala arg 

tta gcg ggc 
leu ala gly 

ccg cga egg 
pro arg arg 

etc ate cat 
leu ile his 

cgt gaa cgc 
arg glu arg 



ggg tct atg 
gly ser met 

gac gac cac 
asp asp his 

ggc ggc gtc 
gly gly val 

etc gag ctg 
leu glu leu 

teg tac gtg 
ser tyr val 

ggc cgc ggc 
gly arg gly 

gat gtc gtc 
asp val val 

gtc gec gag 
val ala glu 

ctg gtg ccg 
leu val pro 

gcg etc aag 
ala leu lys 

cat gga ctg 
his gly leu 

gtg ate get 
val ile ala 

cgt gee gcg 
arg ala ala 

ttg aca gee 
leu thr ala 



31/11 
gec aac aaa 
ala asn lys 

91/31 
atg cag ggg 
met gin gly 

151/51 
gaa etc acc 
glu leu thr 

211/71 
gca ccg ggc 
ala pro gly 

271/91 
ggg gcg gag 
gly ala glu 
331/111 
gac gtc egg 
asp val arg 
391/131 
ate ggc gag 
ile gly glu 
451/151 
gcg gcg egg 
ala ala arg 
511/171 
gac gac gtc 
asp asp val 
571/191 
gtc aat gcg 
val asn ala 
631/211 
gtc gtc gaa 
val val glu 
691/231 
gac gaa ggc 
asp glu gly 
751/251 
cgt egg cga 
arg arg arg 
811/271 
gtc gec att 
val ala ile 



cgt ggc aat gec ggg cag cct ctg 
arg gly asn ala gly gin pro leu 

cac tgg ctg ctg gec egg ctg ggc 
his trp leu leu ala arg leu gly 

egg aca ctg ctg gec cgc gee gag 
arg thr leu leu ala arg ala glu 

ctg ggc cgc acc gca gee gaa ate 
leu gly arg thr ala ala glu ile 

age gat ccc aac gcg gec aac ctg 
ser asp pro asn ala ala asn leu 

gtc acc gac gcg gec gat acc gga 
val thr asp ala ala asp thr gly 

gcg atg ctg acc atg caa ggc aac 
ala met leu thr met gin gly asn 

gtg ctg agg ccg ggt ggc cgc tac 
val leu arg pro gly gly arg tyr 

gca gag cag gtc cgc acc gac ctg 
ala glu gin val arg thr asp leu 

cgt ccg ctg acc gtt gcg gaa tgg 
arg pro leu thr val ala glu trp 

cac gtt gtc acc get tec atg gcg 
his val val thr ala ser met ala 

etc ctg ggt gcg ctg egg ttc gec 
leu leu gly ala leu arg phe ala 

gtc ctg ttg atg cgc cac aca ttc 
val leu leu met arg his thr phe 

gtc gcg cac aaa ccg cac gtc gat 
val ala his lys pro his val asp 



SEQ ID N° 42F 
FIGURE 42F 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



140/185 



1/1 
















31/11 
















ate gcg 


cgt 


gac 


a f- /■» 
acc 


gat 


gac cag 


ggt 


egg 


ccg cgc 


ccg 


gac 


gtc ggc 


ggt cga 


acg 


gta 


ile ala 


arg 


asp 


lie 


asp 


asp gin 


gly 


arg 


leu cys 


leu 


asp 


val 


gly 


gly arg 


thr 


val 


61/21 
















91/ 31 














gtt gtt 


tea 


gcg 


ggc 


gac 


gtg gtg 


cac 


ccg 


cgc Caa 


etc 


gcg 


egg 


age 


tgg cgt 


ccc 


caa 


val val 


ser 


ala 


crl v 


asp 


val val 


hi s 


leu 


a i. y wv_n 




ala 


arg 


ser 


trp arg 


pro 


gin 


121/41 
















151/51 










aag att 


aag 


gtc 


gcg 


ggc 


atg age 


tat 


ccg 


gag aat 


gtc 


ctg 


gee 


get 


ggc gag 


cag 


gtc 


lys ile lys 


val 


ala 


gly met ser 


tyr 


pro 


glu asn 


val 


leu 


ala 


ala 


gly glu 


gin 


val 


181/61 
















211/71 












gtt ctg 


cac 


cgc 


cat 


ccg 


cac tgg 


aat 


cgc 


tta ate 


tgg 


ccc 


gtc 


gtg 


gtg ctg 


gtc 


ttg 


val leu 


his 


arg 


his 


pro 


his trp 


asn 


arg 


leu ile 


trp 


pro 


val 


val 


val leu 


val 


leu 


241/81 
















271/91 
















ctg acc 


ggg 


ttg 


gcg 


gcg 


ttc ggg 


tec 


gga 


ttc gtc 


aac 


teg 


aca 


cct 


tgg cag 


cag 


ate 


leu thr 


gly leu 


ala 


ala 


phe gly 


ser 


gly 


phe val 


asn 


ser 


thr 


pro 


trp gin 


gin 


ile 



SEQ ID N° 43A 
FIGURE 43A 



1/1 31/11 



teg cgc 


gtg 


aca 


teg 


atg 


acc 


agg 


gtc 


ggc 


tgt gtc 


tgg 


acg 


teg 


gcg 


gtc 


gaa 


egg 


tag 


ser arg 


val 


thr 


ser 


met 


thr 


arg 


val 


gly 


cys val 


trp 


thr 


ser 


ala 


val 


glu 


arg 


AMB 


61/21 


















91/31 
















ttg ttt 


cag .egg 


gcg 


acg 


tgg 


tgc 


att 


tgc 


gtt aac 


teg 


cgc 


gga 


get 


ggc 


gtc 


ccc 


aaa 


leu phe 


gin 


arg 


ala 


thr 


trp 


cys 


ile 


cys 


val asn 


ser 


arg 


gly 


ala 


gly val 


pro 


lys 


121/41 


















151/51 
















aga tta 


agg 


teg 


egg 


gca 


tga 


get 


ate 


egg 


aga atg 


tec 


tgg 


ccg 


ctg 


gcg 


age 


agg 


teg 


arg leu 


arg 


ser 


arg 


ala 


OPA 


ala 


ile 


arg 


arg met 


ser 


trp 


pro 


leu 


ala 


ser 


arg 


ser 


181/61 


















211/71 
















ttc tgc 


acc 


gec 


ate 


cgc 


act 


gga 


ate 


get 


taa tct 


ggc 


ccg 


teg 


tgg 


tgc 


tgg 


tct 


tgc 


phe cys 


thr 


ala 


ile 


arg 


thr gly ile 


ala 


OCH ser 


gly pro 


ser 


trp 


cys 


trp 


ser 


cys 


241/81 


















271/91 
















tga ccg 


ggt 


tgg 


egg 


cgt 


teg 


ggt 


ccg 


gat 


teg tea 


act 


cga 


cac 


ctt 


ggc 


age 


aga 


tc 


OPA pro 


gly 


trp 


arg 


arg 


ser 


gly pro 


asp 


ser ser 


thr 


arg 


his 


leu 


gly 


ser 


arg 





SEQ ID N° 43B 
FIGURE 43B 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



141/185 



1 /I 
1/ 1 


















"31/11 


















cgc gcg 


tga 


cat 


cga 


tga 


cca 


9*99* 


ccg 


get 


gtg tct 


gga 


cgt 


egg 


egg 


teg 


aac 


ggt 


agt 


arg ala 


Or A 


nis 


arg 


OPA 


pro 


gly 


ser 


ala 


val ser 


gly 


arg 


arg 


arg 


ser 


asn 


gly 


ser 




















yi/ oi 














tgt etc 


age 




cga 


cgt 


ggt 


gca 


ttt 


gcg 


tta act 


cgc 


gcg 


gag 


ctg 


gcg 


tec 


cca 


aaa 


cys phe 


ser 


gly 


arg 


arg gly 


ala 


pne 


ala 


leu thr 


arg 


ala 


glu 


leu 


ala 


ser 


pro 


lys 


1Z1/ 31 


















1 CI /CI 














oat fcaa 

V4 c* w w w 


aat 


cgc 


yy y 


cat 


gag 


eta 


tec 




craa trrt - 

yua t 


t>L. C 


ggc 


cgc 


tgg 


cga 


gca 


ggt 


cgt 


asp OCH 


gly 


arg 


gly 


his 


glu 


leu 


ser 


gly 


glu cys 


pro 


gly 


arg 


trp 


arg 


ala 


gly 


arg 


181/61 


















211/71 














tct gca 


ccg 


cca 


tec 


gca 


ctg 


gaa 


teg 


ctt 


aat ctg 


gec 


cgt 


cgt 


ggt 


get 


ggt 


ctt 


get 


ser ala 


pro 


pro 


ser 


ala 


leu 


glu 


ser 


leu 


asn leu 


ala 


arg 


arg gly ala 


gly 


leu 


ala 


241/81 


















271/91 
















gac egg 


gtt 


ggc 


ggc 


gtt 


egg 


gtc 


egg 


att 


cgt caa 


etc 


gac 


acc 


ttg 


gca 


gca 


gat 


c 


asp arg 


val 


gly 


gly 


val 


arg 


val 


arg 


ile 


arg gin 


leu 


asp 


thr 


leu 


ala 


ala 


asp 





SEQ ID N° 43C 
FIGURE 43C 



Sequence codante Rv3278c predite par Cole et al., 1998 (Nature 393:537-544) et 
contenant seq4 3A: 

1/1 31/11 

atg age tat ccg gag aat gtc ctg gee get ggc gag cag gtc gtt ctg cac cgc cat ccg 
Met ser tyr pro glu asn val leu ala ala gly glu gin val val leu his arg his pro 
61/21 ' 91/31 

cac tgg aat cgc tta ate tgg ccc gtc gtg gtg ctg gtc ttg ctg acc ggg ttg gcg gcg 
his trp asn arg leu ile trp pro val val val leu val leu leu thr gly leu ala ala 
121/41 151/51 

ttc ggg tec gga ttc gtc aac teg aca cct tgg cag cag ate get aag aac gtg att cac 
phe gly ser gly phe val asn ser thr pro trp gin gin ile ala lys asn val ile his 
181/61 211/71 

gcg gtc ate tgg ggg ate tgg ttg gtg ate gtc ggc tgg etc acg ctg tgg cca ttc ctg 
ala val ile trp gly ile trp leu val ile val gly trp leu thr leu trp pro phe leu 
241/81 271/91 

age tgg ctg acc aca cat ttc gtg gtg acc aac egg egg gtg atg ttc egg cat ggt gtg 
ser trp leu thr thr his phe val val thr asn arg arg val met phe arg his gly val 
301/101 331/111 

ctg acc cgc age ggg ate gac ata ccg eta gca egg ate aac age gtg gag ttc egg gac 
leu thr arg ser gly ile asp ile pro leu ala arg ile asn ser val glu phe arg asp 
361/121 391/131 

egg ate ttc gag egg att ttt cgc acc ggg acg ttg att ate gag tec gcg tea caa gat 
arg ile phe glu arg ile phe arg thr gly thr leu ile ile glu ser ala ser gin asp 
421/141 451/151 

ccg etc gag ttc tac aac att ccg cgc ctg egg gag gtg cat gcg ttg ctg tat cac gag 
pro leu glu phe tyr asn ile pro arg leu arg glu val his ala leu leu tyr his glu 
481/161 511/171 
gtt ttc gac acc ctg ggc tec gac gag teg ccc age tga 
val phe asp thr leu gly ser asp glu ser pro ser OPA 



SEQ ID N° 43D 



FIGURE 43D 
FEUILLE DE REM PLACEMENT (REGLE 26) 



WO 99/09186 



PCT7FR98/01813 



142/185 



ORF d'apres Cole et al., 1998 (Nature 393:537-544) et contenant Rv327Bc 



1 /I 
1/ 1 
















O X/ 1 1 


















taa etc 


gcg 


egg 


age 


tgg 


cgt ccc 


caa 


aag 


att aag 


gtc 


gcg 


ggc 


atg 


age 


tat 


ccg 


gag 


1 All 

ULn leu 


a 1 a 

aia 


arg 


ser 


trp 


arg pro gin 


lys 


ile lys 


vai 


aia 


gly met 


ser 


tyr 


pro 


glu 


fil 10^ 
Di/ ^X 
















Q1 


















aat gtc 


ctg 


gec 


get 




gag cag 


gtc 


y u u 


ctg cac 


cgc 


cac 


ccg 


cac 


tgg 


aac 


cgc 


tta 


asn val 


leu 


axa 


al a 

axa 


gly 


glu gin val 


*/a 1 

vax 


leu his 


arg 


Kir- 

nis 


pro 


his 


trp 


asn 


arg 


leu 


191 / A 1 
















1 Jl/ J X 


















ate tgg 


ccc 


gtc 


gtg 


gtg 


ctg gtc 


ttg 


ctg 


acc ggg 


ttg 


gcg 


gcg 


ttc 


ggg 


tec 


gga 


ttc 


ile trp 


pro 


... i 
vai 


tra 1 
Val 


vax 


leu val 


leu 


leu 


tnr gxy 


1 mi 

Xeu 


ala 


ala 


phe 


gly 


ser 


gly phe 


1 Q 1 / £1 
101/ Ol 
















Oil / ^ 1 

Ail/ /i 


















gtc aac 


teg 


aea 


cct 


tgg 


cag cag 


ate 


get 


aag aac 


gtg 


att 


cac 


gcg 


gtc 


ate 


tgg 


ggg 


val asn 


ser 


thr 


pro 


trp 


gin gin ile 


axa 


lys asn 


vai 


lie 


his 


ala 


vai 


ixe 


trp 


gly 


0 4 1 / fl 1 
Z.H X/ 01 
















01 1 / Q 1 

4. / i / y i 


















ate tgg 


ttg 


gtg 


ate 


gt c 


ggc tgg 


etc 


acg 


ctg tgg 


eca 


t- t- r* 
LLC 


ctg 


age 


tgg 


ctg 


acc 


aca 


ile trp 


leu 


val 


ile 


val 


gly trp 


leu 


thr 


leu trp 


pro 


phe 


leu 


ser 


trp 


leu 


thr 


thr 


301/101 
















331/111 


















cat ttc 


gtg 


gtg 


acc 


aac 


egg egg 


gtg 


atg 


ttc egg 


cat 


ggt 


gtg 


ctg 


acc 


cgc 


age 


ggg 


his phe 


val 


val 


thr 


asn 


arg arg 


val 


met 


phe arg 


his 


gly 


val 


leu 


thr 


arg 


ser 


gly 


361/121 
















391/131 


















ate gac 


ata 


ccg 


eta 


gca 


egg ate 


aac 


age 


gtg gag 


ttc 


egg 


gac 


egg 


ate 


ttc 


gag 


egg 


ile asp 


ile 


pro 


leu 


ala 


arg ile 


asn 


ser 


val glu 


phe 


arg 


asp 


arg 


ile 


phe 


glu 


arg 


421/141 
















451/151 


















att ttt 


cgc 


acc 


ggg 


acg 


ttg att 


ate 


gag 


tec gcg 


tea 


caa 


gat 


ccg 


etc 


gag 


ttc 


tac 


ile phe 


arg thr gly 


thr 


leu ile 


ile 


glu 


ser ala 


ser 


gin 


asp 


pro 


leu 


glu 


phe 


tyr 


481/161 
















511/171 


















aac att 


ccg 


cgc 


ctg 


egg 


gag gtg 


cat 


gcg 


ttg ctg 


tat 


cac 


gag 


gtt 


ttc 


gac 


acc 


ctg 


asn ile 


pro 


arg 


leu 


arg 


glu val 


his 


ala 


leu leu 


tyr 


his 


glu 


val 


phe 


asp 


thr 


leu 



541/181 

ggc tec gac gag teg ccc age tga 
gly ser asp glu ser pro ser OPA 



SEQ ID N° 43F 
FIGURE 43F 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



143/185 



1/1 

gcc aag atg gat gtc tac caa cgc acc gcc 
ala lys met asp val tyr gin arg thr ala 
61/21 

acc acc cat ate ggt teg gcg ggc atg gcg 
thr thr his ile gly ser ala gly met ala 
121/41 

ccg atg ggg gtt tac age ctg gac tec get 
pro met gly val tyr ser leu asp ser ala 
181/61 

ttg ccg tat acc caa gtc gga ccc aat cac 
leu pro tyr thr gin val gly pro asn his 
241/81 

ttt aac tec atg cag gtc tgt cag aag tec 
phe asn ser met gin val cys gin lys ser 
301/101 

aac ctg caa ate ccg cag tac aag cat teg 
asn leu gin ile pro gin tyr lys his ser 
361/121 

cca ggc aaa ggc tec gcg ttc ttc ttt cac 
pro gly lys gly ser ala phe phe phe his 
421/141 
gtg gcg ate 
val ala ile 



31/11 

gcc ggc tgg cag ccg etc aag acc ggt ate 
ala gly trp gin pro leu lys thr gly ile 
91/31 

ccg gaa gcc aag age gga tat ccg gcc act 
pro glu ala lys ser gly tyr pro ala thr 
151/51 

ttt ggc acc gcg ccg aat ccc ggt ggc ggg 
phe gly thr ala pro asn pro gly gly gly 
211/71 

tgg tgg agt ggc gac gac aat age ccc acc 
trp trp ser gly asp asp asn ser pro thr 
271/91 

cag tgc ccg ttc age acg gcc gac age gag 
gin cys pro phe ser thr ala asp ser glu 
331/111 

gtc gtg atg ggc gtc aac aag gcc aag gtc 
val val met gly val asn lys ala lys val 
391/131 

acc acc gac ggc ggg ccc acc gcg ggt tgt 
thr thr asp gly gly pro thr ala gly cys 



SEQ ID N° 44A 



FIGURE 44A 



1/1 

cca aga tgg atg tct acc aac gca ccg ccg 
pro arg trp met ser thr asn ala pro pro 
61/21 

cca ccc ata teg gtt egg egg gca tgg cgc 
pro pro ile ser val arg arg ala trp arg 
121/41 

cga tgg ggg ttt aca gcc tgg act ccg ctt 
arg trp gly phe thr ala trp thr pro leu 
181/61 

tgc cgt ata ccc aag teg gac cca ate act 
cys arg ile pro lys ser asp pro ile thr 
241/81 

tta act cca tgc agg tct gtc aga agt ccc 
leu thr pro cys arg ser val arg ser pro 
301/101 

acc tgc aaa tec cgc agt aca age att egg 
thr cys lys ser arg ser thr ser ile arg 
361/121 

cag gca aag get ccg cgt tct tct ttc aca 
gin ala lys ala pro arg ser ser phe thr 
421/141 
tgg cga tc 
trp arg 



31/11 

ccg get ggc age cgc tea aga ccg gta tea 
pro ala gly ser arg ser arg pro val ser 
91/31 

egg aag cca aga gcg gat ate egg cca etc 
arg lys pro arg ala asp ile arg pro leu 
151/51 

ttg gca ccg cgc cga ate ccg gtg gcg ggt 
leu ala pro arg arg ile pro val ala gly 
211/71 

ggt gga gtg gcg acg aca ata gcc cca cct 
gly gly val ala thr thr ile ala pro pro 
271/91 

agt gcc cgt tea gca egg ccg aca gcg aga 
ser ala arg ser ala arg pro thr ala arg 
331/111 

teg tga tgg gcg tea aca agg cca agg tec 
ser OPA trp ala ser thr arg pro arg ser 
391/131 

cca ccg acg gcg ggc cca ccg egg gtt gtg 
pro pro thr ala gly pro pro arg val val 



SEQ ID N° 44B 
FEUILLE DE REMP^£^EI^^REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



144/185 



1/1 31/11 



Cclcl gat 


gga 


tgt 


eta 


cca 


acg 


cac 


cgc 


cgc 


egg ctg 


gca 


gec 


get 


caa 


gac 


egg 


tat 


cac 


gin asp 


gly 


cys 


leu 


pro 


thr 


his 


arg 


arg 


arg leu 


ala 


ala 


ala 


gin asp 


arg 


tyr 


his 




















91/31 














Celt* t-V-a 




egg 


ttc 


ggc 


ggg 


cat 


ggc 


gec 


gga age 


caa 


gag 


egg 


ata 


tec 


ggc 


cac 


tec 


UxS pit; 


tyr 


arg phe 


gly 


gly his 


gly ala 


gly ser 


gin 


glu 


arg 


ile 


ser 


gly 


his 


ser 


191/41 


















151/51 














/tat* n n ri 

gat ggg 


ggt 


tta 


cag 


cct 


gga 


etc 


cgc 


ttt 


tgg cac 


cgc 


gec 


gaa 


tec 


egg 


tgg 


egg 


gtt 


asp giy 


gly 


leu gin pro 


gly leu arg phe 


trp his 


arg 


ala 


glu 


ser 


arg 


trp 


arg 


val 


Ifll /CI 


















211/71 












ftrc ata 


tac 


cca 


agt 


egg 


acc 


caa 


tea 


ctg 


gtg gag 


tgg 


a. 


cga 


caa 


tag 


ccc 


cac 


ctt 


ala val 


tyr 


pro 


ser 


arg 


thr 


gin 


ser 


leu 


val glu trp 


arg 


arg gin AMB 


pro 


his 


leu 


241/81 


















271/91 
















taa etc 


cat 


gca 


ggt 


ctg 


tea 


gaa 


gtc 


cca 


gtg ccc 


gtt 


cag 


cac 


ggc 


cga 


cag 


cga 


gaa 


OCH leu 


his 


ala gly leu 


ser 


glu val 


pro 


val pro 


val 


gin 


his 


gly 


arg 


gin 


arg 


glu 


301/101 


















331/111 










cct gca 


aat 


ccc 


gca 


gta 


caa 


gca 


ttc 


ggt 


cgt gat 


ggg 


cgt 


caa 


caa 


ggc 


caa 


ggt 


ccc 


pro ala 


asn 


pro 


ala 


val 


gin 


ala phe 


gly 


arg asp 


gly 


arg 


gin 


gin 


gly 


gin 


gly pro 


361/121 


















391/131 


















agg caa 


agg 


etc 


cgc 


gtt 


ctt 


ctt 


tea 


cac 


cac cga 


egg 


egg 


gec 


cac 


cgc 


ggg 


ttg 


tgt 


arg gin 


arg 


leu 


arg 


val 


leu 


leu 


ser 


his 


his arg 


arg 


arg 


ala 


his 


arg 


gly 


leu 


cys 



421/141 
ggc gat c 
gly asp 



SEQ ID N° 44C 
FIGURE 44C 



FEU1LLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



145/185 



Sequence codante Rv0309 predite par Cole et al., 1998 (Nature 393:537-544) et 
contenant Seq4 4A: 



1/1 31/11 



atg age 


cga 


etc 


eta 


get 


ttg 


ctg 


tgc 


get 


gcg gta 


tgc 


acg 


ggc 


tgc 


gtt 


get 


gtg 


gtt 


Met ser 


arg 


leu 


leu 


ala 


leu 


leu 


cys 


ala 


ala val 


cys 


thr 


gly cys 


val 


ala 


val 


val 


61/21 


















91/31 


















etc gcg 


cca 


gtg 


age 


ctg 


gec 


gtc 


gtc 


aac 


ccg tgg 


ttc 


gcg 


aac 


teg 


gtc 


ggc 


aat 


gec 


leu ala 


pro 


val 


ser 


leu 


axa 


val 


val 


asn 


pro trp 


phe 


ala 


asn 


ser 


val 


gly 


asn 


ala 


121/41 


















151/51 
















act cag 


gtg 


gtt 


teg 


gtg 


gtg 


gga 


acc 


ggc 


ggt teg 


acg 


gec 


aag 


atg 


gat 


gtc 


tac 


caa 


thr gin val val 


ser 


val 


vax 


gly thr gly gly ser 


thr 


ala 


lys 


met 


asp 


val 


tyr gin 


181/61 


















211/71 


















cgc acc 


gee 


gee 


ggc 


tgg 


cag 


ccg 


etc 


aag 


acc ggt 


ate 


acc 


acc 


cat 


ate 


ggt 


teg 


gcg 


arg thr 


ala 


ala 


gly trp 


gin 


pro 


leu 


lys 


thr gly 


ile 


thr 


tnr 


his 


ile 


gly 


ser 


ala 


241/81 


















271/91 
















ggc atg 


gcg 


ccg 


gaa 


gec 


aag 


age 


gga 


tat 


ccg gee 


act 


ccg 


atg 


ggg 


gtt 


tac 


age 


ctg 


gly met 


ala 


pro 


glu 


ala 


lys 


ser 


gly 


tyr 


pro ala 


thr 


pro 


met 


gly 


val 


tyr 


ser 


leu 


301/101 


















331/111 
















gac tec 


get 


ttt 


ggc 


acc 


gcg 


ccg 


aat 


ccc 


ggt ggc 


ggg 


ttg 


ccg 


tat 


acc 


caa 


gtc 


gga 


asp ser 


ala 


phe gly thr 


ala 


pro 


asn 


pro 


gly gly gly 


leu 


pro 


tyr 


thr 


gin 


val 


gly 


361/121 


















391/131 
















ccc aat 


cac 


tgg 


tgg 


agt 


ggc 


gac 


gac 


aat 


age ccc 


acc 


ttt 


aac 


tec 


atg 


cag 


gtc 


tgt 


pro asn 


his 


trp 


trp 


ser 


gxy 


asp 


asp 


asn 


ser pro 


thr 


phe 


asn 


ser 


met 


gin 


val 


cys 


421/141 


















451/151 














cag aag 


tec 


cag 


tgc 


ccg 


ttc 


age 


acg 


gee 


gac age 


gag 


aac 


ctg 


caa 


ate 


ccg 


cag 


tac 


gin lys 


ser 


gin 


cys 


pro 


phe 


ser 


thr 


ala 


asp ser 


glu 


asn 


leu 


gin ile pro 


gin 


tyr 


481/161 


















511/171 
















aag cat 


teg 


gtc 


gtg 


atg 


ggc 


gtc 


aac 


aag 


gec aag 


gtc 


cca 


ggc 


aaa 


ggc 


tec 


gcg 


ttc 


lys his 


ser 


val 


val 


met 


gly 


val 


asn 


lys 


ala lys 


val 


pro 


gly 


lys 


gly 


ser 


ala 


phe 


541/181 


















571/191 


















ttc ttt 


cac 


acc 


acc 


gac 


ggc 


ggg 


ccc 


acc 


gcg ggt 


tgt 


gtg 


gcg 


ate 


gac 


gat 


gee 


acg 


phe phe his 


•thr 


thr 


asp 


gly 


gly pro 


thr 


ala gly 


cys 


val 


ala 


ile 


asp 


asp 


ala 


thr 


601/201 


















631/211 














ctg gtg 


cag 


ate 


ate 


cgt 


tgg 


ctg 


egg 


cct 


ggt gcg 


gtg 


ate 


gcg 


ate 


gec 


aag 


taa 




leu val gin 


ile 


ile 


arg 


trp 


leu 


arg 


pro 


gly ala 


val 


ile 


ala 


ile 


ala 


lys 


OCH 





SEQ ID N° 44D 
FIGURE 44D 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT7FR98/01813 



146/185 



ORF d'apres Cole et al . , 1998 (Nature 393:537-544) et contenant Rv0309 



1/1 

tga gcg atg age 
OPA ala met ser 
61/21 

gtg gtt etc gcg 
val val leu ala 
121/41 

aat gec act cag 
asn ala thr gin 
181/61 

tac caa cgc acc 
tyr gin arg thr 
241/81 

teg gcg ggc atg 
ser ala gly met 
301/101 

age ctg gac tec 
ser leu asp ser 
361/121 

gtc gga ccc aat 
val gly pro asn 
421/141 

gtc tgt cag aag 
val cys gin lys 
481/161 

cag tac aag cat 
gin tyr lys his 
541/181 

gcg ttc ttc ttt 
ala phe phe phe 
601/201 

gec acg ctg gtg 

ala thr leu val 

661/221 

taa 

OCH 



cga etc eta get 
arg leu leu ala 

cca gtg age ctg 
pro val ser leu 

gtg gtt teg gtg 
val val ser val 

gec gee ggc tgg 
ala ala gly trp 

gcg ccg gaa gec 
ala pro glu ala 

get ttt ggc acc 
ala phe gly thr 

cac tgg tgg agt 
his trp trp ser 

tec cag tgc ccg 
ser gin cys pro 

teg gtc gtg atg 
ser val val met 

cac acc acc gac 
his thr thr asp 

cag ate ate cgt 
gin ile ile arg 



31/11 
ttg ctg tgc get 
leu leu cys ala 

91/31 
gee gtc gtc aac 
ala val val asn 

151/51 
gtg gga acc ggc 
val gly thr gly 

211/71 
cag ccg etc aag 
gin pro leu lys 

271/91 
aag age gga tat 
lys ser gly tyr 

331/111 
gcg ccg aat ccc 
ala pro asn pro 

391/131 
ggc gac gac aat 
gly asp asp asn 

451/151 
ttc age acg gec 
phe ser thr ala 

511/171 
ggc gtc aac aag 
gly val asn lys 

571/191 
ggc ggg ccc acc 
gly gly pro thr 

631/211 
tgg ctg egg cct 
trp leu arg pro 



gcg gta tgc acg 
ala val cys thr 

ccg tgg ttc gcg 
pro trp phe ala 

ggt teg acg gec 
gly ser thr ala 

acc ggt ate acc 
thr gly ile thr 

ccg gee act ccg 
pro ala thr pro 

ggt ggc ggg ttg 
gly gly gly leu 

age ccc acc ttt 
ser pro thr phe 

gac age gag aac 
asp ser glu asn 

gee aag gtc cca 
ala lys val pro 

gcg ggt tgt gtg 
ala gly cys val 

ggt gcg gtg ate 
gly ala val ile 



ggc tgc gtt get 
gly cys val ala 

aac teg gtc ggc 
asn ser val gly 

aag atg gat gtc 
lys met asp val 

acc cat ate ggt 
thr his ile gly 

atg ggg gtt tac 
met gly val tyr 

ccg tat acc caa 
pro tyr thr gin 

aac tec atg cag 
asn ser met gin 

ctg caa ate ccg 
leu gin ile pro 

ggc aaa ggc tec 
gly lys gly ser 

gcg ate gac gat 
ala ile asp asp 

gcg ate gec aag 
ala ile ala lys 



SEQ ID N° 44F 
FIGURE 44F 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



147/185 



Fragment clone en fusion avec phoA 



I /I 

II 1 










gga 


A en 1 All 
asp 4CU 






61/21 






tec ggt 


acre 


cag 


opr 111 V 
sex yxy 


O C X 


rt 1 in 

y iii 


121/41 






rrrrfc cct 


tgc 


cac 


y Jr 


cys 


hi <? 

11X O 


181/61 






y ^ y 


cca 


gac 


lie vol 


£J X \J 


asp 


941 /fll 

All/ OX 






rrtrr caa 

y *- y wy 


CCC 


ayy 


val arg 




arg 


orjT / 1 ni 

OUl/ J.UJ. 






y L-y 


aag 


ecc 


ser val 


lys 


pro 


•3 £1 /I 91 
JOl/ X*£ 1. 






rrat nfcer 


yay 


a rt r* 


y iy vcli. 


glu 


OCX 


491/141 








ayy 


cca 


ser pro 


arg 


pro 


481/161 






ctg gtc 


ate 


ag t 


leu val 


ile 


ser 


541/181 






acc tgc 


tgt 


tgc 


thr cys 


cys 


cys 


601/201 






ggc gcg 


ttg 


'CtC 


gly ala leu 


leu 


661/221 






teg get 


gee 


get 


ser ala 


ala 


,,-1 

val 


721/241 






age cac 


att 


yy y 


ser his 


ile 


y xy 


781/261 






acc gtc 


agg 


gca 


thr val 


arg 


ala 


841/281 






ate gee 


aae 


gcg 


ile ala 


asn 


ala 


901/301 






egg aca 


age 


cga 


arg thr 


ser 


arg 



cac cag gtc ate 
his gin val ile 

agg cac cag cat 
arg his gin his 

teg cga tec ttg 
ser arg ser leu 

egg gca tgc cgc 
arg ala cys arg 

atg gcg aat get 
met ala asn ala 



aae 
asn 


egg 
arg 


egg 
arg 


tac 
tyr 


agg 
arg 


acg 
thr 


ttg 
leu 


tec 
ser 


egg 
arg 


cct 
pro 


tga 
OPA 


gcg 
ala 


egg 
arg 


gcg 
ala 


ate 
ile 


get 
ala 


cac 
his 


cac 
his 


tgg 
trp 


ccg 
pro 


agt 
ser 


teg 
ser 


gcg 
ala 


gee 
ala 


acc 
thr 


teg 
ser 


acg 
thr 


gec 
ala 


gcg 
ala 


cgc 
arg 


aaa 
lys 


gtc 
val 


tea 
ser 


ccg 
pro 


agg 
arg 


egg 
arg 


egg 
arg 


tgt 
cys 


cct 
pro 


cct 
pro 



tga ggc cgc ccg 
OPA gly arg pro 







**i /i 1 


egg 


cga 


gat ggt 


arg 


arg 


asp gly 






qi y*i 
y 1/ s i 


cag 


caa 


cat cgc 


gin gin 


his arg 






Xwl/ D 1 


gga 


tga 


egg egg 


gly OPA 


arg trp 






911 fl 1 


gtc 


ggc 


aay llu 


val 


gly 


lys leu 






£. I 1/ 3 1 


egg 


ggg 


tea ccg 


arg gly 


ser pro 






JJl/ 111 


aac 


cgc 


cac gec 


asn 


arg 


nis ala 






*3 Q 1 f~\ 0 1 

jy i/ ui 


teg 


teg 


cga ccg 


ser 


ser 


arg pro 






4^1 / 1 
1 0 If 101 


egg 


gga 


agg atg 


arg gly 


arg met 






3 X If 1 1 1 


agg 


cgc 


gga aag 


arg 


arg 


gly lys 






o i if i y i 


ggc 


gee 


y y y cl 


gly ala 


pro gly 






C1 1 /Oil 
O.Jl/<£ll 


gac 


ggc 


age gee 


asp gly 


ser ala 






691/231 


gcg 


acc 


gec tgc 


ala 


thr 


ala cys 






/ 01/251 


teg gtg 


ccc ctg 


ser 


val 


y\ yr\ 1 pit 






811/271 


cgc 


tec 


ata teg 


arg 


ser 


ile ser 






871/291 


cat 


gtg 


atg aac 


his 


val 


met asn 






931/311 


cgc 


tgg 


acg ggg 


arg 


trp 


thr gly 



gat cga ggc teg 
asp arg gly ser 

gat ggc cag cat 
asp gly gin his 

ggc ata get age 
gly ile ala ser 

teg ggc gcg ggt 
ser gly ala gly 

gcg aag tgg tag 
ala lys trp AMB 

cga ttg tec tea 
arg leu ser ser 

get age agt egg 
ala ser ser arg 

tgc aat tea gtc 
cys asn ser val 

ccg ctg cgt tgc 
pro leu arg cys 

tag ccg tac gee 
AMB pro tyr ala 

gtg gtg teg gcg 
val val ser ala 

cag ccg cgc cgc 
gin pro arg arg 

ggg tag cgc ate 
gly AMB arg ile 

ctg ggc ggc aga 
leu gly gly arg 

cga tgc gtg ctt 
arg cys val leu 

ctt gta gcg tat 
leu val ala tyr 



gac ccg cag gca 
asp pro gin ala 

gec gcg ccg teg 
ala ala pro ser 

gcg cac cag gtc 
ala his gin val 

tag age ggt age 
AMB ser gly ser 

ccg egg atg atg 
pro arg met met 

ccg ttg gtc tec 
pro leu val ser 

egg gec aac gec 
arg ala asn ala 

aac teg aag tag 
asn ser lys AMB 

aag ccc agt acc 
lys pro ser thr 

act ccg age att 
thr pro ser ile 

gec teg gee tgt 
ala ser ala cys 

egg atg tgc tec 
arg met cys ser 

gcg teg aca tac 
ala ser thr tyr 

teg atg agg aat 
ser met arg asn 

gcg cac cag tat 
ala his gin tyr 

ggc cgt ttc cgc 
gly arg phe arg 



SEQ ID N° 45ZA 
FIGURE 45ZA 

FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



148/185 



961/321 

tea get cgt cgc tgc 
ser ala arg arg cys 
1021/341 

gat tga cct cgt ate 
asp OPA pro arg ile 
1081/361 

att acg tga cag tct 
ile thr OPA gin ser 
1141/381 

atg ctt gac cag ate 
met leu asp gin ile 
1201/401 

cgt ggc ggg ggc ttc 
arg gly gly gly phe 
1261/421 

ate ate ggt ctg ggg 
ile ile gly leu gly 
1321/441 

ttc ccg ata etc age 
phe pro ile leu ser 
1381/461 

acc ggt cct egg ttg 
thr gly pro arg leu 
1441/481 

cag cgt cgt acc aag 
gin arg arg thr lys 



ggc gee gec ggg ata 
gly ala ala gly ile 

ate tga gtt agt tgc 
ile OPA val ser cys 

gtc ggc aag gag gga 
val gly lys glu gly 

gag age get etc tac 
glu ser ala leu tyr 

cgc gca ccg acc gcg 
arg ala pro thr ala 

atg ttg gtt tec ggc 
met leu val ser gly 

gtt ttc ggt ttt gtc 
val phe gly phe val 

tec ggc agg atg gat 
ser gly arg met asp 

ggg gec ggg ggc tea 
gly ala gly gly ser 



991/331 

gaa teg ccc gcg aac 
glu ser pro ala asn 
1051/351 

ccg cgc aat ggg cat 
pro arg asn gly his 
1111/371 

cgc atg cca etc tec 
arg met pro leu ser 
1171/391 

gee gaa gat ccc aag 
ala glu asp pro lys 
1231/411 

egg egg cgc ctg cag 
arg arg arg leu gin 
1291/431 

gtg gcg ttc aaa gag 
val ala phe lys glu 
1351/451 

gtg atg ttc ggt ggt 
val met phe gly gly 
1411/471 

cgt ggc gga teg get 
arg gly gly ser ala 
1471/491 

ttc acc age cgt atg 
phe thr ser arg met 



cag 
gin 


tgg 
trp 


tac 
tyr 


ggc gca 
gly ala 


ccg 
pro 


cgt 
arg 


gtt 
val 


ate 
ile 


ggt 
gly 


gat 
asp 


cat 
his 


gag 
glu 


cag 
gin 


egg 
arg 


ttc 
phe 


gca 
ala 


teg 
ser 


agt 
ser 


gtc 
val 


ggc gcg 
gly ala 


gcg 
ala 


ttg 
leu 


ttc 
phe 


acc 
thr 


atg 
met 


ate 

ile 


gga 
gly 


agt 
ser 


gtg 
val 


gtg 
val 


tat 
tyr 


gee 
ala 


ate 
ile 


get 
ala 


ggg 

gly 


get 
ala 


teg 
ser 


cgc 
arg 


gaa gat 
glu asp 


c 







SEQ ID N° 45ZA (suite) 
FIGURE 45ZA (suite) 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



149/185 



fragment seq45ZA en decalage moins 1 pen 
1/1 

ate tec ccg gac acc agg tea tec ggc gag 
ile ser pro asp thr arg ser ser gly glu 
61/21 

ccg gta gec aga ggc acc age ate age aac 
pro val ala arg gly thr ser ile ser asn 
121/41 

gtc ctt gec act cgc gat cct tgg gat gac 
val leu ala thr arg asp pro trp asp asp 
181/61 

teg tgc cag acc ggg cat gec gcg teg gca 
ser cys gin thr gly his ala ala ser ala 
241/81 

tgc gac cca gga tgg cga atg etc ggg ggt 
cys asp pro gly trp arg met leu gly gly 
301/101 

egg tga age cca acc ggc ggt aca acc gee 
arg OPA ser pro thr gly gly thr thr ala 
361/121 

gtg tgg aga gca gga cgt tgt cct cgt cgc 
val trp arg ala gly arg cys pro arg arg 
421/141 

ccc cga ggc cac ggc ctt gag cgc ggg gaa 
pro arg gly his gly leu glu arg gly glu 
481/161 

tgg tea tea gtc ggg cga teg eta ggc gcg 
trp ser ser val gly arg ser leu gly ala 
541/181 

cct get gtt gee acc act ggc egg gcg ccc 
pro ala val ala thr thr gly arg ala pro 
601/201 

gcg cgt tgc tea gtt egg egg ccg acg gca 
ala arg cys ser val arg arg pro thr ala 
661/221 

egg ctg ccg tta cct cga egg ccg cga ccg 
arg leu pro leu pro arg arg pro arg pro 
721/241 

gec aca ttg ggg cgc gca aag tct egg tgc 
ala thr leu gly arg ala lys ser arg cys 
781/261 

ccg tea ggg cat cac cga ggc ggc get cca 
pro ser gly his his arg gly gly ala pro 
841/281 

teg cca acg cgc ggt gtc etc etc atg tga 
ser pro thr arg gly val leu leu met OPA 
901/301 

gga caa gee gat gag gec gec cgc get gga 
gly gin ala asp glu ala ala arg ala gly 
961/321 

cag etc gtc get gcg gcg ccg ccg gga tag 
gin leu val ala ala ala pro pro gly AMB 



tr la phase de lecture 
31/11 

atg gtg ate gag get egg acc cgc agg cat 

met val ile glu ala arg thr arg arg his 
91/31 

ate gcg atg gec age atg ccg cgc cgt egg 

ile ala met ala ser met pro arg arg arg 
151/51 

ggt ggg gca tag eta gcg cgc acc agg tea 

gly gly ala AMB leu ala arg thr arg ser 
211/71 

age tgt egg gcg egg gtt aga gcg gta gcg 

ser cys arg ala arg val arg ala val ala 
271/91 

cac egg cga agt ggt age cgc gga tga tgt 

his arg arg ser gly ser arg gly OPA cys 
331/111 

acg ccc gat tgt cct cac cgt tgg tct ccg 

thr pro asp cys pro his arg trp ser pro 
391/131 

gac egg eta gca gtc ggc ggg cca acg cct 

asp arg leu ala val gly gly pro thr pro 
451/151 

gga tgt gca att cag tea act cga agt age 

gly cys ala ile gin ser thr arg ser ser 
511/171 

gaa age cgc tgc gtt gca age cca gta cca 

glu ser arg cys val ala ser pro val pro 
571/191 

c< ?<? gat age cgt acg cca etc cga gca ttg 

arg asp ser arg thr pro leu arg ala leu 
631/211 

gcg ccg tgg tgt egg egg cct egg cct gtt 

ala pro trp cys arg arg pro arg pro val 
691/231 

cct gec age cgc gee gee gga tgt get cca 

pro ala ser arg ala ala gly cys ala pro 
751/251 

ccc tgg ggt age gca teg cgt cga cat aca 

pro trp gly ser ala ser arg arg his thr 
811/271 

tat cgc tgg gcg gca gat cga tga gga ata 

tyr arg trp ala ala asp arg OPA gly ile 
871/291 

tga acc gat gcg tgc ttg cgc acc agt ate 

OPA thr asp ala cys leu arg thr ser ile 
931/311 

egg ggc ttg tag cgt atg gec gtt tec get 

arg gly leu AM3 arg met ala val ser ala 
991/331 

aat cgc ccg cga acc agt ggt acg gcg cag 

asn arg pro arg thr ser gly thr ala gin 



SEQ ID N° 45ZB 



FIGURE 45ZB 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



150/185 



lU*sl/ OH 1 
















1051/351 
















ate gac etc 


guci 


t* r>a 




gag 




gtt 


y i^i* 


cgc gca atg 


ggc 


ate 


wy \~ 


gtg 


u ua 


teg 


erta 
y L.a 


ile asp leu 


vax 


ser 


ser 


glu 


leu 


val 


did 


arg ala met gly ile 


dig 


in 1 

val 


1 All 

1 c u 


SCI 


veil 


lUo 1/ JO X 
















1111/ J ' 1 
















uta cgt ydL 


ay u 


/■» f- rr 


i.i~y 


y wet 




a nfl 
cagy 


gac 


nra tctc rar 

UV<u LU^i V*CIV* 


tct 


ccg 


ate 


atg 


age 


age 


an a 
yya 


leu arg asp 


ser 


leu 


ser 


ala 


arg 


arg 


a e o 


ala. Cyo UlS 


ser 


pro 




l lie i» 


SAT 
SCI 


ser 


gly 


11^1/ joi 
















I 1*71 /"*Q1 

II / 1/ J71 
















Vh/* +*t*/"t arp 

U^C Cl<»**— 


a ff a 
ay a 


teg 


aga 


gcg 


etc 


tct 


a eg 


LLvj clay alC 


cca 


art ft* 

ay E. 


tea 


cat 


cga 


gtg 


tec 


cys leu tnj. 


arg 


ser 


arg 


ala 


leu 


ser 


f hr 

1.111 


pro lys ne 


pro 


ser 


coy* 


ills 


a 1 y 


val 


ser 


1 o m /4 m 

l£ Ul/ ^Ul 
















l£ <3 1 / 4 11 
















gtg, gcg ggg 




tec 


gcg 


cac 


cga 


ccg 


cgc 


ggc ygc gec 


t gc 


agg 


gcg 


egg 


cgt 


tgt 


tea 


val aia giy 


ala 


ser 


ala 


his 


arg 


pro 


a r g 


giy giy aia 


cys 


a rg 


al a 
ala 


a rg 


a rg 


cys 


ser 


l^Ol/ 4^1 
















1291/431 
















tea teg gtc 


tgg 


gga 


tgt 


tgg 


ttt 


ccg 


gcg 


tgg cgt tea 


aag 


aga 


cca 


uy a 


t eg 


gaa 


gtt 


Set ScL Val 


trp 


gly cys 


trp phe pro 


ala 


trp arg ser 


lys 


arg 




opa 


CAT* 
S C 1 


glu val 


1321/441 
















1351/451 
















tec cga tac 


tea 


gcg 


ttt 


teg 


gtt 


ttg 


teg 


tga tgt teg 


gtg 


gtg 


tgg 


tgt 


atg 


cca 


tea 


ser arg tyr 


ser 


ala 


phe 


ser 


val 


leu 


ser 


OPA cys ser 


val 


val 


trp 


cys 


met 


pro 


ser 


1381/461 
















1411/471 
















ccg gtc etc 


ggt 


tgt 


ccg 


gca 


gga 


tgg 


ate 


gtg gcg gat 


egg 


ctg 


ctg 


ggg 


ctt 


cgc 


gee 


pro val leu 


gly cys 


pro 


ala 


gly trp 


ile 


val ala asp 


arg 


leu 


leu 


gly 


leu 


arg 


ala 


1441/481 
















1471/491 
















age gtc gta 


cca 


agg 


ggg 


ccg 


ggg 


get 


cat 


tea cca gec 


gta 


tgg 


aag 


ate 








ser val val 


pro 


arg gly pro 


gly ala 


his 


ser pro ala 


val 


trp 


lys 


ile 









SEQ ID N° 45ZB (suite) 
FIGURE 45ZB (suite) 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



151/185 



fragment seq45ZA en decalage moins 2 pox 
1/1 

tct ccc egg aca cca ggt cat ccg gcg aga 
ser pro arg thr pro gly his pro ala arg 
61/21 

egg tag cca gag gca cca gca tea gca aca 
arg AMB pro glu ala pro ala ser ala thr 
121/41 

tec ttg cca etc gcg ate ctt ggg atg acg 
ser leu pro leu ala ile leu gly met thr 
181/61 

cgt gec aga ccg ggc atg ccg cgt egg caa 
arg ala arg pro gly met pro arg arg gin 
241/81 

gcg acc cag gat ggc gaa tgc teg ggg gtc 
ala thr gin asp gly glu cys ser gly val 
301/101 

ggt gaa gec caa ccg gcg gta caa ccg cca 
gly glu ala gin pro ala val gin pro pro 
361/121 

tgt gga gag cag gac gtt gtc etc gtc gcg 
cys gly glu gin asp val val leu val ala 
421/141 

ccc gag gec acg gee ttg age gcg ggg aag 
pro glu ala thr ala leu ser ala gly lys 
481/161 

ggt cat cag teg ggc gat cgc tag gcg egg 
gly his gin ser gly asp arg AMB ala arg 
541/181 

ctg ctg ttg cca cca ctg gee ggg cgc ccc 
leu leu leu pro pro leu ala gly arg pro 
601/201 

cgc gtt get cag ttc ggc ggc cga egg cag 
arg val ala gin phe gly gly arg arg gin 
661/221 

ggc tgc cgt tac etc gac ggc cgc gac cgc 
gly cys arg tyr leu asp gly arg asp arg 
721/241 

cca cat tgg ggc gcg caa agt etc ggt gee 
pro his trp gly ala gin ser leu gly ala 
781/261 

cgt cag ggc ate acc gag gcg gcg etc cat 
arg gin gly ile thr glu ala ala leu his 
841/281 

cgc caa cgc gcg gtg tec tec tea tgt gat 
arg gin arg ala val ser ser ser cys asp 
901/301 

gac aag ccg atg agg ccg ccc gcg ctg gac 
asp lys pro met arg pro pro ala leu asp 



tr la phase de lecture 
31/11 

tgg tga teg agg etc gga ccc gca ggc ate 
trp OPA ser arg leu gly pro ala gly ile 
91/31 

teg cga tgg cca gca tgc cgc gec gtc ggg 
ser arg trp pro ala cys arg ala val gly 
151/51 

gtg ggg cat age tag cgc gca cca ggt cat 
val gly his ser AMB arg ala pro gly his 
211/71 

get gtc ggg cgc ggg tta gag egg tag cgt 
ala val gly arg gly leu glu arg AMB arg 
271/91 

acc ggc gaa gtg gta gec gcg gat gat gtc 
thr gly glu val val ala ala asp asp val 
331/111 

cgc ccg att gtc etc acc gtt ggt etc egg 
arg pro ile val leu thr val gly leu arg 
391/131 

acc ggc tag cag teg gcg ggc caa cgc etc 
thr gly AMB gin ser ala gly gin arg leu 
451/151 

gat gtg caa ttc agt caa etc gaa gta get 
asp val gin phe ser gin leu glu val ala 
511/171 

aaa gec get gcg ttg caa gec cag tac cac 
lys ala ala ala leu gin ala gin tyr his 
571/191 

ggg ata gee gta cgc cac tec gag cat tgg 
gly ile ala val arg his ser glu his trp 
631/211 

cgc cgt ggt gtc ggc ggc etc ggc ctg ttc 
arg arg gly val gly gly leu gly leu Dhe 
691/231 

ctg cca gee gcg ccg ccg gat gtg etc cag 
leu pro ala ala pro pro asp val leu gin 
751/251 



cct ggg 


gta 


gcg 


cat 


cgc 


gtc 


gac 


ata 


cac 


pro gly 


val 


ala 


his 


arg 


val 


asp 


ile 


his 


811/271 














ate get 


ggg 


egg 


cag 


ate 


gat 


gag 


gaa 


tat 


ile ala 


gly 


arg 


gin 


ile 


asp 


glu 


glu 


tyr 


871/291 












gaa ccg 


atg 


cgt 


get 


tgc 


gca 


cca 


gta 


teg 


glu pro 


met 


arg 


ala 


cys 


ala 


pro 


val 


ser 


931/311 
















ggg get 


tgt 


age 


gta 


tgg 


ccg 


ttt 


ccg 


etc 


gly ala 


cys 


ser 


val 


trp 


pro 


phe 


pro 


leu 



SEQ ID N° 45ZC 
FIGURE 45ZC 

FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



152/185 



yoi/ Jii 
















QQ1 /l^l 
















age teg teg 


m 4» mm 

ctg 


egg 


cgc 


cgc 


egg 


gat 


aga 


ate gee cgc 


gaa 


cca 


gtg 


gta 


egg 


cgc 


aga 


sei ssr ser 


leu 


arg 


arg 


arg 


arg 


asp 


arg 


lie aia arg 


giu 


pro 


,,,1 
vai 


,,-1 
vai 


arg 


arg 


arg 


















1 HM / ** M 
i uji / jjI 
















teg acc teg 


f- a ♦* 


cat 


ctg 


a 

agt 


tag 


ttg 


ccc 


mm mm mm ~\ m% mm mm 

gcg caa tgg 


gca 


tec 


gcg 


tgt 


tat 


egg 


tat 


IcU tut Scl 


tyr 


hi s 


leu 


ser 


AMB 


leu 


pro 


aid gin trp 


aia 


ser 


aid 


cys 


tyr 


arg 


tyr 


1UOX/ -JO 1 
















1 1 1 1 /^71 
nil/ j/i 
















tac gtg aca 


gtc 


tgt 


egg 


caa 


gga 


ggg 


acg 


Cat gec act 


etc 


cga 


tea 


tga 


gca 


gcg 


mm Lm 

gat 


tyr val thr 


val 


cys 


a r g 


gin 


gly gly thr 


nis aia tnr 


leu 


arg 


ser 


OPA 


ala 


aia 


asp 


1141/381 
















1171 /*3Q1 
11 11/ J?l 
















get tga cca 


gat 


cga 


g a g 


cgc 


tct 


eta 


cgc 


M « m\ m* mm* mm. |b mm\ jm. 

cga aga tec 


caa 


~ 4- 4. 

gtt 


cgc 


ate 


gag 


tgt 


ccg 


ala OPA pro 


asp 


arg 


glu 


arg 


ser 


leu 


arg 


arg arg ser 


-m 1 _ 

gin 


...1 
vai 


arg 


ile 


glu 


cys 


pro 


1201/401 
















1 Oil 1 1 
l£ J 1/ H 11 
















tgg egg ggg 


ctt 


ccg 


cgc 


acc 


gac 


cgc 


gcg 


gcg gcg cct 


gca 


ggg 


cgc 


ggc 


gtt 


gtt 


cat 


trp arg gly leu pro 


a rg 


thr 


asp 


arg 


ala 


ala ala pro 


ala 


mw"\ t. 

gly 


arg gly val 


vai 


his 


1261/421 
















lt3l/ n j 1 
















cat egg tct 


ggg 


gat 


gut 


ggt 


ttc 


egg 


cgt 


ggc gtt caa 


aga 


gac 


cat 


gat 


egg 


aag 


ttt 


his arg ser 


gly 


asp 


Vol 


gly phe 


arg 


arg 


yiy val gin 


arg 


asp 


his 


asp 


arg 


lys 


pne 


1321/441 
















1 0 J 1/ IJJ. 
















ccc gat act 


cag 


cgt 


ttt 


egg 


ttt 


tgt 


cgt 


ffat" rrt*t* rnn 


tgg 


tgt 


ggt 


gta 


tgc 


Cat 


cac 


pro asp thr 


gin 


arg 


phe 


arg 


phe 


cys 


arg 


asp val arg 


trp 


cys 


gly val 


cys 


his 


his 


1381/461 
















1411/471 
















egg tec teg 


gtt 


gtc 


egg 


cag 


gat 


gga 


teg 


tgg egg ate 


ggc 


tgc 


tgg 


ggc 


ttc 


gcg 


cca 


arg ser ser 


val 


val 


arg 


gin 


asp gly 


ser 


trp arg ile 


gly 


cys 


trp gly phe 


ala 


pro 


1441/481 
















1471/491 
















gcg teg tac 


caa 


ggg 


ggc 


egg 


ggg 


etc 


att 


cac cag ccg 


tat 


gga 


aga 


tc 








ala ser tyr gin gly 


gly arg gly leu 


ile 


his gin pro 


tyr gly 


arg 











SEQ ID N° 45ZC (suite 1) 
FIGURE 45ZC (suite 1) 



ORF de seq 45ZA 


directement 


en fusion avec phoA 
















cag tct gtc 


ggc 


aag 


gag 


gga 


cgc atg 


cca 


etc tec gat 


cat 


gag 


cag 


egg 








gin ser val 


gly lys 


glu 


gly arg met 


pro 


leu ser asp 


his 


glu 


gin 


arg 








1141/381 














1171/391 
















atg ctt gac 


cag 


ate 


gag 


age 


get etc 


tac 


gec gaa gat 


ccc 


aag 


ttc 


gca 


teg 


agt 


gtc 


met leu asp 


gin 


ile 


glu 


ser 


ala leu 


tyr 


ala glu asp pro lys 


phe 


ala 


ser 


ser 


val 


1201/401 














1231/411 
















cgt ggc ggg 


ggc 


ttc 


cgc 


gca 


ccg acc 


gcg 


egg egg cgc 


ctg 


cag 


ggc 


gcg 


gcg 


ttg 


ttc 


arg gly gly gly phe 


arg 


ala 


pro thr 


ala 


arg arg arg 


leu 


gin 


gly 


ala 


ala 


leu 


phe 


1261/421 














1291/431 
















ate ate ggt 


ctg 


ggg 


atg 


ttg 


gtt tec 


ggc 


gtg gcg ttc 


aaa 


gag 


acc 


atg 


ate 


gga 


agt 


ile ile gly 


leu 


gly 


met 


leu 


val ser 


gly 


val ala phe 


lys 


glu 


thr 


met 


ile 


gly 


ser 


1321/441 














1351/451* 
















ttc ccg ata 


etc 


age 


gtt 


ttc 


ggt ttt 


gtc 


gtg atg ttc 


ggt 


ggt 


gtg 


gtg 


tat 


gec 


ate 


phe pro ile 


leu 


ser 


val 


phe 


gly phe 


val 


val met phe 


gly gly val 


val 


tyr 


ala 


ile 


1381/461 














1411/471* 
















acc ggt cct 


egg 


ttg 


tec 


ggc 


agg atg 


gat 


cgt ggc gga 


teg 


get 


get 


ggg 


get 


teg 


cgc 


thr gly pro 


arg 


leu 


ser 


gly 


arg met 


asp 


arg gly gly 


ser 


ala 


ala 


gly 


ala 


ser 


arg 


1441/481 














1471/491 
















cag cgt cgt 


acc 


aag 


ggg 


gec 


ggg ggc 


tea 


ttc acc age 


cgt 


atg 


gaa 


gat 


c 






gin arg arg 


thr 


lys 


gly 


ala 


gly gly 


ser 


phe thr ser 


arg 


met 


glu 


asp 









SEQ ID N° 45A 
FEUILLE DE REMP^E^JE^REGLE 26) 



WO 99/09186 



PCT7FR98/01813 



153/185 



Sequence Rv2169c predite par Cole et al . , 1998 (Nature 393:537-544) et contenant 
Seq45A 

1/1 31/11 



atg cca 


etc 


tec 


gat 


cat 


gag 


cag 


egg 


atg ctt gac 


cag 


ate 


gag 


age 


get 


etc 


tac 


gec 


Met pro 


leu 


ser 


asp 


his 


glu 


gin 


arg 


met leu asp 


gin 


ile 


glu 


ser 


ala 


leu 


tyr 


ala 


61/21 
















91/31 
















gaa gat 


ccc 


aag 


ttc 


gca 


teg 


agt 


gtc 


cgt ggc ggg 


ggc 


ttc 


cgc 


gca 


ccg 


acc 


gcg 


egg 


glu asp 


pro 


lys 


phe ala 


ser 


ser 


val 


arg gly gly 


gly phe 


arg 


ala 


pro 


thr 


ala 


arg 


121/41 
















151/51 
















egg cgc 


ctg 


cag 


ggc 


gcg 


gcg 


ttg 


ttc 


ate ate ggt 


ctg 


ggg 


atg 


ttg 


gtt 


tec 


ggc 


gtg 


arg arg 


leu 


gin 


gly ala 


ala 


leu 


phe 


ile ile gly 


leu 


gly 


met 


leu 


val 


ser 


gly 


val 


181/61 
















211/71 
















gcg ttc 


aaa 


gag 


acc 


atg 


ate 


gga 


agt 


ttc ccg ata 


etc 


age 


gtt 


ttc 


ggt 


ttt 


gtc 


gtg 


ala phe 


lys 


glu 


thr 


met 


ile 


gly 


ser 


phe pro ile 


leu 


ser 


val 


phe gly 


phe 


val 


val 


241/81 
















271/91 
















atg ttc 


ggt 


ggt 


gtg 


gtg 


tat 


gec 


ate 


acc ggt cct 


egg 


ttg 


tec 


ggc 


agg 


atg 


gat 


cgt 


met phe 


gly gly val 


val 


tyr 


ala 


ile 


thr gly pro 


arg 


leu 


ser 


gly 


arg 


met 


asp 


arg 


301/101 
















331/111 














ggc gga 


teg 


get 


get 


ggg 


get 


teg 


cgc 


cag cgt cgt 


acc 


aag 


ggg 


gec 


ggg 


ggc 


tea 


ttc 


gly gly 


ser 


ala 


ala 


gly ala 


ser 


arg 


gin arg arg 


thr 


lys 


gly 


ala 


gly 


gly 


ser 


phe 


361/121 
















391/131 












acc age 


cgt 


atg 


gaa 


gat 


egg 


ttc 


egg 


cgc cgc ttc 


gac 


gag 


taa 












thr ser 


arg 


met 


glu 


asp 


arg 


phe 


arg 


arg arg phe 


asp 


glu 


OCH 













SEQ ID N° 45D 
FIGURE 45D 



ORF d'apres Cole et al., 1998 (Nature 393:537-544) et contenant Rv2169c 



1/1 


















31/11 


















tga cag 


tct 


gtc 


ggc 


aag 


gag 


gga 


cgc 


atg 


cca etc 


tec 


gat 


cat 


gag 


cag 


egg 


atg 


ctt 


OPA gin 


ser 


val 


gly lys 


glu 


giy 


arg 


met 


pro leu 


ser 


asp 


his 


glu 


gin 


arg 


met 


leu 


61/21 


















91/31 


















gac cag 


ate 


gag 


age 


get 


etc 


tac 


gec 


gaa 


gat ccc 


aag 


ttc 


gca 


teg 


agt 


gtc 


cgt 


ggc 


asp gin 


ile 


glu 


ser 


ala 


leu 


tyr 


ala 


glu 


asp pro 


lys 


phe 


ala 


ser 


ser 


val 


arg 


gly 


121/41 


















151/51 














ggg ggc 


ttc 


cgc 


gca 


ccg 


acc 


gcg 


egg 


egg 


cgc ctg 


cag 


ggc 


gcg 


gcg 


ttg 


ttc 


ate 


ate 


gly gly 


phe 


arg 


ala 


pro 


thr 


ala 


arg 


arg 


arg leu 


gin 


gly 


ala 


ala 


leu phe 


ile 


ile 


181/61 


















211/71 


















ggt ctg 


ggg 


atg 


ttg 


gtt 


tec 


ggc 


gtg 


gcg 


ttc aaa 


gag 


acc 


atg 


ate 


gga 


agt 


ttc 


ccg 


gly leu 


gly met 


leu 


val 


ser 


gly 


val 


ala 


phe lys 


glu 


thr 


met 


ile 


gly 


ser 


phe 


pro 


241/81 


















271/91 














ata etc 


age 


gtt 


ttc 


ggt 


ttt 


gtc 


gtg 


atg 


ttc ggt 


ggt 


gtg 


gtg 


tat 


gec 


ate 


acc 


ggt 


ile leu 


ser 


val 


phe gly phe 


val 


val 


met 


phe gly gly 


val 


val 


tyr 


ala 


ile 


thr 


gly 


301/101 


















331/111 
















cct egg 


ttg 


tec 


ggc 


agg 


atg 


gat 


cgt 


ggc 


gga teg 


get 


get 


ggg 


get 


teg 


cgc 


cag 


cgt 


pro arg 


leu 


ser 


gly 


arg 


met 


asp 


arg 


gly 


gly ser 


ala 


ala 


gly 


ala 


ser 


arg gin 


arg 


361/121 


















391/131 
















cgt acc 


aag 


ggg 


gec 


ggg 


ggc 


tea 


ttc 


acc 


age cgt 


atg 


gaa 


gat 


egg 


ttc 


egg 


cgc 


cgc 


arg thr 


lys 


gly 


ala 


gly gly 


ser 


phe 


thr 


ser arg 


met 


glu 


asp 


arg phe 


arg 


arg 


arg 



421/141 
ttc gac gag taa 
phe asp glu OCH 



SEQ ID N° 45F 



FEUILLE DE REM^^IE^REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



154/185 



1/1 

cag ccg cgc cgc ate gac 
gin pro arg arg ile asp 
61/21 

tec ggt gaa cat cgc acc 
ser gly glu his arg thr 
121/41 

ccg gec aac tea cag aca 
pro ala asn ser gin thr 
181/61 

cgt cgc ate gec gtc etc 
arg arg ile ala val leu 
241/81 

teg ggc teg aag cca age 
ser gly ser lys pro ser 
301/101 

acc gcg cag acc aag get 
thr ala gin thr lys ala 











31/11 




cag 


ggc 


etc 


acg 


ccc ggt 


cac 


gin gly leu 


thr 


pro gly 


his 










ft 1 /IT 

91/31 




agg 


tta 


ggc 


age 


aat ccc 


gcg 


arg 


leu 


gly 


ser 


asn pro 


ala 










1 CI /CI 

101/ Dl 




ccc 


tct 


acg 


acg 


cag ggt 


aug 


pro 


ser 


thr 


met 


gin gly 


met 










211/71 




gec 


gec 


gtt 


age 


ate gee 


gee 


ala 


ala 


val 


ser 


ile ala 


ala 










271/91 




ggc 


gga 


cca 


ctt 


ccg gac 


gcg 


gly gly pro 


leu 


pro asp 


ala 










331/111 




etc 


aag 


age 


gcg 


cac atg 


gtg 


leu 


lys 


ser 


ala 


his met 


val 



SEQ ID N° 46A 
FIGURE 46A 



ttc tec gcg ttc etc aac aat 
phe ser ala phe leu asn asn 

gac ccg cac ccc act cgc cga 
asp pro his pro thr arg arg 

egg acc ccc aga cgc cac tgc 
arg thr pro arg arg his cys 

act gtc gtt gee ggc tgc teg 
thr val val ala gly cys ser 

aag ccg ctg gtc gag gag gec 
lys pro leu val glu glu ala 

ctg acg gtc aac ggc aag ate 
leu thr val asn gly lys ile 



1/1 

age cgc gee .gca teg acc 
ser arg ala ala ser thr 
61/21 

ccg gtg aac ate gca cca 
pro val asn ile ala pro 
121/41 

egg cca act cac aga cac 
arg pro thr his arg his 
181/61 

gtc gca teg ccg tec teg 
val ala ser pro ser ser 
241/81 

egg get cga age caa gcg 
arg ala arg ser gin ala 
301/101 

ccg cgc aga cca agg etc 
pro arg arg pro arg leu 











31/11 




agg 


gec 


tea 


cgc 


ccg gtc 


act 


arg 


ala 


ser 


arg 


pro val 


thr 










91/31 




ggt 


tag 


gca 


gca 


ate ccg 


egg 


gly AMB ala 


ala 


ile pro 


arg 










151/51 




cct 


eta 


cga 


tgc 


agg gta 


tgc 


pro 


leu 


arg 


cys 


arg val 


cys 










211/71 




ccg 


ccg 


tta 


gca 


teg ccg 


cca 


pro 


pro 


leu 


ala 


ser pro 


pro 










271/91 




gcg 


gac 


cac 


ttc 


egg acg 


cga 


ala 


asp 


his 


phe 


arg thr 


arg 










331/111 




tea 


aga 


gcg 


cgc 


aca tgg 


tgc 


ser 


arg 


ala 


arg 


thr trp 


cys 



SEQ ID N° 46B 
FIGURE 46B 



tct ccg cgt tec tea aca att 
ser pro arg ser ser thr ile 

acc cgc acc cca etc gec gac 
thr arg thr pro leu ala asp 

gga ccc cca gac gee act gee 
gly pro pro asp ala thr ala 

ctg teg ttg ccg get get cgt 
leu ser leu pro ala ala arg 

age cgc tgg teg agg agg cca 
ser arg trp ser arg arg pro 

tga egg tea acg gca aga tc 
OPA arg ser thr ala arg 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



155/185 



1/1 31/11 







rat" 






ggg 


cct 


cac 


gee 


egg tea 


ctt 


etc 


cgc 


get 


cct 


caa 


caa 


ttc 


QJ-u Qi.u 


P rO 


hi S 


arg 


p r o 


gly pro his 


aXa 


arg ser 


leu 


leu 


arg 


val 


pro 


gin 


gin phe 




















91/31 


















i*yy uya 


aca 








gtt 


agg 


cag 


caa 


tec cgc 


gga 


cec 


gca 


cec 


cac 


teg 


ccg 


acc 




thr 


ear 


Vi i c 


n 1 n 
y x ii 


val 


arg gin 


gin 


ser arg gly 


pro 


axa 


pro 


ms 


ser 


pro 


thr 


121/41 


















151/51 
















ggc caa 


etc 


aca 


gac 


acc 


etc 


tac 


gat 


gca 


ggg tat 


gcg 


gac 


cec 


cag 


acg 


cca 


ctg 


ccg 


gly gin 


leu 


thr 


asp 


thr 


leu 


tyr 


asp 


ala 


gly tyr 


ala 


asp 


pro 


gin 


thr 


pro 


leu 


pro 


181/61 


















211/71 














teg cat 


cgc 


cgt 


cct 


cgc 


cgc 


cgt 


tag 


cat 


cgc cgc 


cac 


tgt 


cgt 


tgc 


egg 


ctg 


etc 


gtc 


ser his 


arg 


arg 


pro 


arg 


arg 


arg 


AMB 


his 


arg arg 


his 


cys 


arg 


cys 


arg 


leu 


leu 


val 


241/81 


















271/91 
















ggg etc 


gaa 


gec 


aag 


egg 


egg 


acc 


act 


tec 


gga cgc 


gaa 


gec 


get 


ggt 


cga 


gga 


ggc 


cac 


gly leu 


glu 


ala 


lys 


arg 


arg 


thr 


thr 


ser 


gly arg glu 


ala 


ala 


gly 


arg 


gly 


gly his 


301/101 


















331/111 
















cgc gca 


gac 


caa 


ggc 


tct 


caa 


gag 


cgc 


gca 


cat ggt 


get 


gac 


ggt 


caa 


egg 


caa 


gat 


c 


arg ala 


asp 


gin 


gly 


ser 


gin 


glu 


arg 


ala 


his gly 


ala 


asp 


gly 


gin 


arg 


gin 


asp 





SEQ ID N° 46C 
FIGURE 46C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



156/185 



Sequence codante Rvl411c predite par Cole et al., 1998 (Nature 393: 537-544) et 
contenant seq46A: 

1/1 31/11 

atg egg acc ccc aga cgc cac tgc cgt cgc ate gec gtc etc gee gee gtt age ate gec 
Met arg thr pro arg arg his cys arg arg ile ala val leu ala ala val ser ile ala 
61/21 91/31 



gee act gtc gtt gec ggc tgc teg teg ggc teg aag cca age ggc gga cca ctt ccg gac 
ala thr val val ala gly cys ser ser gly ser lys pro ser gly gly pro leu pro asp 
121/41 151/51 



gcg aag 


ccg 


ctg 


gtc 


gag 


gag 


gec 


acc 


gcg 


cag acc 


aag 


get 


etc 


aag 


age 


gcg 


cac 


atg 


ala lys 


pro 


leu 


val glu 


glu ala 


thr 


ala 


gin thr 


lys 


ala 


leu 


lys 


ser 


ala 


his 


met 


1 Q *1 /CI 

181/ 61 


















211/71 
















gtg ctg 


acg 


gtc 


aac 


ggc 


aag 


ate 


ccg 


gga 


ctg tct 


ctg 


aag 


acg 


ctg 


age 


ggc 


gat 


etc 


val leu 


thr 


val 


asn 


gly 


lys 


ile 


pro 


gly 


leu ser 


leu 


lys 


thr 


leu 


ser 


gly 


asp 


leu 


241/81 


















271/91 














acc acc 


aac 


ccc 


acc 


gee 


gcg 


acg 


gga 


aac 


gtc aag 


etc 


acg 


ctg 


ggt 


ggg 


tct 


gat 


ate 


thr thr 


asn 


pro 


thr 


ala 


ala 


thr 


gly 


asn 


val lys 


leu 


thr 


leu 


gly gly 


ser 


asp 


ile 


oUI/ 1UJ. 


















331/111 
















cfoi gec 


gac 


ttc 


gtg 


gtg 


ttc 


gac 


ggg 


acc 


ctg tac 


gee 


acc 


ctg 


acg 


ccc 


aac 


cag 


tgg 


asp ala 


asp 


phe 


val 


val 


phe 


asp 


gly 


ile 


leu tyr 


ala 


thr 


leu 


thr 


pro 


asn 


gin 


trp 


361/121 


















391/131 












age gat 


ttc 


ggt 


ccc 


gec 


gee 


gac 


ate 


tac 


gac ccc 


gee 


cag 


gtg 


ctg 


aat 


ccg 


gat 


acc 


ser asp 


phe 


gly pro 


ala 


ala 


asp 


ile 


tyr 


asp pro 


ala 


gin 


val 


leu 


asn 


pro 


asp 


thr 


421/141 


















451/151 














ggc ctg 


gec 


aac 


gtg 


ctg 


gcg 


aat 


ttc 


gec 


gac gca 


aaa 


gec 


gaa 


ggg 


egg 


gat 


acc 


ate 


gly leu 


ala 


asn 


val 


leu 


ala 


asn 


phe 


ala 


asp ala 


lys 


ala 


glu 


gly 


arg 


asp 


thr 


ile 


481/161 


















511/171 














aac ggc 


cag 


aac 


acc 


ate 


cgc 


ate 


age 


ggg 


aag gta 


teg 


gca 


cag 


gcg 


gtg 


aac 


cag 


ata 


asn gly 


gin 


asn 


thr 


ile 


arg 


ile 


ser 


gly 


lys val 


ser 


ala 


gin 


ala 


val 


asn 


gin 


ile 


541/181 


















571/191 
















gcg ccg 


ccg 


ttc 


aac 


gcg 


acg 


cag 


ccg 


gtg 


ccg gcg 


acc 


gtc 


tgg 


att 


cag 


gag 


acc 


ggc 


ala pro 


pro 


phe 


asn 


ala 


thr gin 


pro 


val 


pro ala 


thr 


val 


trp 


ile 


gin 


glu 


thr 


gly 


601/201 


















631/211 














gat cat 


caa 


ctg 


gca 


cag 


gec 


cag 


ttg 


gac 


cgc ggc 


teg 


ggc 


aat 


tec 


gtc 


cag 


atg 


acc 


asp his 


gin 


leu 


ala 


gin 


ala 


gin 


leu 


asp 


arg gly 


ser 


gly 


asn 


ser 


val 


gin 


met 


thr 


661/221 


















691/231 
















ttg teg 


aaa 


tgg 


ggc 


gag 


aag 


gtc 


cag 


gtc 


acg aag 


ccc 


ccg 


gtg 


age 


tga 








leu ser 


lys 


trp 


gly glu 


lys 


val 


gin 


val 


thr lys 


pro 


pro 


val 


ser 


OPA 









SEQ ID N° 46D 
FIGURE 4 6D 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



157/185 

ORF d'apres par Cole et al., 1998 (Nature 393: 537-544) 
et contenant la sequence codante Rvl411c: 



1/1 

tag etc acc cag gtt gga ccg gtt cag tgt 
AMB leu thr gin val gly pro val gin cys 
61/21 

gtc ggg caa tac ate gac gac cgt cag aca 
val gly gin tyr ile asp asp arg gin thr 
121/41 

gee ggc gtc ggc ggt aac cat egg acc gcg 
ala gly val gly gly asn his arg thr ala 
181/61 

etc acg ccc ggt cac ttc tec gcg ttc etc 
leu thr pro gly his phe ser ala phe leu 
241/81 

ggc age aat ccc gcg gac ccg cac ccc act 
gly ser asn pro ala asp pro his pro thr 
301/101 

acg atg cag ggt atg egg acc ccc aga cgc 
thr met gin gly met arg thr pro arg arg 
361/121 

gtt age ate gee gee act gtc gtt gee ggc 
val ser ile ala ala thr val val ala gly 
421/141 

cca ctt ccg gac gcg aag ccg ctg gtc gag 
pro leu pro asp ala lys pro leu val glu 
481/161 

age gcg cac atg gtg ctg acg gtc aac ggc 
ser ala his met val leu thr val asn gly 
541/181 

age ggc gat etc acc acc aac ccc acc gee 
ser gly asp leu thr thr asn pro thr ala 
601/201 

ggg tct gat ate gat gee gac ttc gtg gtg 
gly ser asp ile asp ala asp phe val val 
661/221 

ccc aac cag tgg age gat ttc ggt ccc gee 
pro asn gin trp ser asp phe gly pro ala 
721/241 

aat ccg gat acc ggc ctg gee aac gtg ctg 
asn pro asp thr gly leu ala asn val leu 
781/261 

egg gat acc ate aac ggc cag aac acc ate 
arg asp thr ile asn gly gin asn thr ile 
841/281 

gtg aac cag ata gcg ccg ccg ttc aac gcg 
val asn gin ile ala pro pro phe asn ala 
901/301 

cag gag acc ggc gat cat caa ctg gca cag 
gin glu thr gly asp his gin leu ala gin 
961/321 

gtc cag atg acc ttg teg aaa tgg ggc gag 
val gin met thr leu ser lys trp gly glu 
1021/341 
tga 
OPA 



31/11 

etc ggc cat cac gtc ggc ggt gaa ttg gee 
leu gly his his val gly gly glu leu ala 
91/31 

cac gee gtt gac age gat cga gtc gee gtg 
his ala val asp ser asp arg val ala val 
151/51 

gat ggt cag ccg cgc cgc ate gac cag ggc 
asp gly gin pro arg arg ile asp gin gly 
211/71 

aac aat tec ggt gaa cat cgc acc agg tta 
asn asn ser gly glu his arg thr arg leu 
271/91 

cgc cga ccg gee aac tea cag aca ccc tct 
arg arg pro ala asn ser gin thr pro ser 
331/111 

cac tgc cgt cgc ate gee gtc etc gee gee 
his cys arg arg ile ala val leu ala ala 
391/131 

tgc teg teg ggc teg aag cca age ggc gga 
cys ser ser gly ser lys pro ser gly gly 
451/151 

gag gec acc gcg cag acc aag get etc aag 
glu ala thr ala gin thr lys ala leu lys 
511/171 

aag ate ccg gga ctg tct ctg aag acg ctg 
lys ile pro gly leu ser leu lys thr leu 
571/191 

gcg acg gga aac gtc aag etc acg ctg ggt 
ala thr gly asn val lys leu thr leu gly 
631/211 

ttc gac ggg ate ctg tac gee acc ctg acg 
phe asp gly ile leu tyr ala thr leu thr 
691/231 

gec gac ate tac gac ccc gee cag gtg ctg 
ala asp ile tyr asp pro ala gin val leu 
751/251 

gcg aat ttc gee gac gca aaa gee gaa ggg 
ala asn phe ala asp ala lys ala glu gly 
811/271 

cgc ate age ggg aag gta teg gca cag gcg 
arg ile ser gly lys val ser ala gin ala 
871/291 

acg cag ccg gtg ccg gcg acc gtc tgg att 
thr gin pro val pro ala thr val trp ile 
931/311 

gec cag ttg gac cgc ggc teg ggc aat tec 
ala gin leu asp arg gly ser gly asn ser 
991/331 

aag gtc cag gtc acg aag ccc ccg gtg age 
lys val gin val thr lys pro pro val ser 



SEQ ID N° 46F 



FEUILLE DE REMRUKCEaEN7*REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



158/185 



1/1 

gag ctg gtc aac ggc gcc ggc 
glu leu val asn gly ala gly 
61/21 

ctg gcc gat gcc cag cag atg 
leu ala asp ala gin gin met 
121/41 

gtg ttg gtg gcc teg ggc age 
val leu val ala ser gly ser 
181/61 

ttc gac get gtg atg gac gcg 
phe asp ala val met asp ala 
241/81 

egg gtg ctg etc gag cag ggt 
arg val leu leu glu gin gly 
301/101 

ggg ttg ggc aat gcc gcc ggt 
gly leu gly asn ala ala gly 









31/11 




ate 


gac 


gac 


gcc gcc 


gtc 


ile 


asp 


asp 


ala ala 


val 








91/31 




gtc 


gag 


gcg 


gca ctg 


ggc 


val glu 


ala 


ala leu 


gly 








151/51 




aac 


cat 


gtg 


gcg ccc 


a tt 


asn 


his 


..,1 
val 


ala pro 


lie 








211/71 




aac 


gtg 


egg 


ggt gcc 


tgg 


asn 


val 


arg 


gly ala 


trp 








271/91 




cag 


ggc 


ggc 


age gtg 


gtg 


gin 


gly 


gly 


ser val 


val 








331/111 




tac 


age 


gcg 


tac tgc 


ccg 


tyr 


ser 


ala 


tyr cys 


pro 



SEQ ID N° 47A 
FIGURE 47A 



gtg acc tgc egg ccg gac age 
val thr cys arg pro asp ser 

cga tat ggc cgt ttg gac gga 
arg tyr gly arg leu asp gly 

acc gag atg gcc gtc gag gac 
thr glu met ala val glu asp 

ctg gtg tgt egg gcg gcc gga 
leu val cys arg ala ala gly 

ctg gtg teg tec gtt cgc ggc 
leu val ser ser val arg gly 

teg aag gcg ggc acc gat c 
ser lys ala gly thr asp 



1/1 

age tgg tea acg gcg ccg gca 
ser trp ser .thr ala pro ala 
61/21 

tgg ccg atg ccc age aga tgg 
trp pro met pro ser arg trp 
121/41 

tgt tgg tgg cct egg gca gca 
cys trp trp pro arg ala ala 
181/61 

teg acg ctg tga tgg acg cga 
ser thr leu OPA trp thr arg 
241/81 

ggg tgc tgc teg age agg gtc 
gly cys cys ser ser arg val 
301/101 

ggt tgg gca atg ccg ccg gtt 
gly trp ala met pro pro val 









31/11 




teg 


acg 


acg 


ccg ccg 


teg 


ser 


thr 


thr 


pro pro 


ser 








91/31 




teg 


agg 


egg 


cac tgg 


gcc 


ser 


arg 


arg 


his trp 


ala 








151/51* 




acc 


atg 


tgg 


cgc cca 


tta 


thr 


met 


trp 


arg pro 


leu 








211/71 




acg 


tgc 


ggg 


gtg cct 


ggc 


thr 


cys 


gly 


val pro 


gly 








271/91 




agg 


gcg 


gca 


gcg tgg 


tgc 


arg 


ala 


ala 


ala trp 


cys 








331/111 




aca 


gcg 


cgt 


act gcc 


cgt 


thr 


ala 


arg 


thr ala 


arg 



SEQ ID N° 47B 
FIGURE 47B 



tga cct gcc ggc egg aca gcc 
OPA pro ala gly arg thr ala 

gat atg gcc gtt tgg acg gag 
asp met ala val trp thr glu 

ccg aga tgg ccg teg agg act 
pro arg trp pro ser arg thr 

tgg tgt gtc ggg egg ccg gac 
trp cys val gly arg pro asp 

tgg tgt cgt ccg ttc gcg gcg 
trp cys arg pro phe ala ala 

cga agg egg gca ccg ate 
arg arg arg ala pro ile 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



159/185 



1/1 31/11 



get ggt 


caa 


egg 


cgc 


egg 


cat 


cga 


cga 


cgc 


cgc cgt 


cgt 


gac 


ctg 


ccg 


gec 


gga 


cag 


cct 


ala gly 


gin 


arg 


arg 


arg 


his 


arg 


arg 


arg 


arg arg 


arg 


asp 


leu 


pro 


ala 


gly 


gin pro 


61/21 


















91/31 


















ggc cga 


tgc 


cca 


gca 


gat 


ggt 


cga 


ggc 


ggc 


act ggg 


ccg 


ata 


tgg 


ccg 


ttt 


gga 


egg 


agt 


gly arg 


cys 


pro 


ala 


asp 


gly 


arg 


gly 


gly 


thr gly pro 


ile 


trp 


pro 


phe 


gly 


arg 


ser 


1 O 1 / A 1 


















151/51 
















gtt ggt 


ggc 


etc 


ggg 


cag 


caa 


cca 


tgt 


ggc 


gee cat 


tac 


cga 


gat 


ggc 


cgt 


cga 


gga 


ctt 


val gly 


gly 


leu gly 


gin 


gin 


pro 


cys 


gly 


ala his 


tyr 


arg 


asp 


gly 


arg 


arg 


gly 


leu 


181/61 


















211/71 














cga cgc 


tgt 


gat 


gga 


cgc 


gaa 


cgt 


gcg 


ggg 


tgc ctg 


get 


ggt 


gtg 


teg 


ggc 


ggc 


egg 


acg 


arg arg 


cys 


asp 


gly 


arg 


glu 


arg 


ala 


gly 


cys leu 


ala 


gly 


val 


ser 


gly 


gly 


arg 


thr 


241/81 


















271/91 














ggt get 


get 


cga 


gca 


ggg 


tea 


ggg 


egg 


cag 


cgt ggt 


get 


ggt 


gtc 


gtc 


cgt 


teg 


egg 


egg 


gly ala 


ala 


arg 


ala 


gly 


ser 


gly 


arg 


gin 


arg gly 


ala 


gly 


val 


val 


arg 


ser 


arg 


arg 


301/101 


















331/111 












gtt ggg 


caa 


tgc 


cgc 


egg 


tta 


cag 


cgc 


gta 


ctg ccc 


gtc 


gaa 


ggc 


ggg 


cac 


cga 


tc 




val gly 


gin 


cys 


arg 


arg 


leu 


gin 


arg 


val 


leu pro 


val 


glu 


gly 


gly his 


arg 







SEQ ID N° 47C 
FIGURE 47C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



160/185 



Sequence codante Rvl714 predite par Cole et al., 1998 (Nature 393: 537-544) et 
contenant seq 47A: 



1/1 

gtg gag gaa atg gcg ctg get 
val glu glu met ala leu ala 
61/21 

cag gac aag teg ate ctg ate 
gin asp lys ser ile leu ile 
121/41 

gcg ctg gec gac gcg gga gcg 
ala leu ala asp ala gly ala 
181/61 

gag ctg gtc aac ggc gec ggc 
glu leu val asn gly ala gly 
241/81 

ctg gec gat gec cag cag atg 
leu ala asp ala gin gin met 
301/101 

gtg ttg gtg gee teg ggc age 
val leu val ala ser gly ser 
361/121 

ttc gac get gtg atg gac gcg 
phe asp ala val met asp ala 
421/141 

egg gtg ctg etc gag cag ggt 
arg val leu leu glu gin gly 
481/161 

ggg ttg ggc aat gee gee ggt 
gly leu gly asn ala ala gly 
541/181 

ttg gec aag aca ttg gcg gee 
leu ala lys thr leu ala ala 
601/201 

ccg acg gtg ttt egg tec gcg 
pro thr val phe arg ser ala 
661/221 

gee acc egg gag gcg atg etc 
ala thr arg glu ala met leu 
721/241 

ttc gtc ggc gee ctg ate tat 
phe val gly ala leu ile tyr 
781/261 

atg tat ctg gac ggc ggg tac 
met tyr leu asp gly gly tyr 



31/11 

cag cag gtg ccg aac ctg 
gin gin val pro asn leu 
91/31 

acc ggc gcg acc ggt teg 
thr gly ala thr gly ser 
151/51 

egg ctg aca ctg gee ggc 
arg leu thr leu ala gly 

211/71 
ate gac gac gee gee gtc 
ile asp asp ala ala val 

271/91 

gtc gag gcg gca ctg ggc 
val glu ala ala leu gly 

331/111 
aac cat gtg gcg ccc att 
asn his val ala pro ile 

391/131 
aac gtg egg ggt gee tgg 
asn val arg gly ala trp 

451/151 
cag ggc ggc age gtg gtg 
gin gly gly ser val val 

. 511/171 
tac age gcg tac tgc ccg 
tyr ser ala tyr cys pro 

571/191 
gaa tgg ggc ggt cac ggc 
glu trp gly gly his gly 

631/211 
gtg acc gag tgg atg ttc 
val thr glu trp met phe 

691/231 
gee egg ate ccg ttg cgc 
ala arg ile pro leu arg 

751/251 
ctg etc age gac gee teg 
leu leu ser asp ala ser 

811/271 
acc gca tgc tga 
thr ala cys OPA 



SEQ ID N° 47D 
FIGURE 47D 



ggt ctg gcg cgc ttc age gtg 
gly leu ala arg phe ser val 

ttg ggc cga gtt gee gee egg 
leu gly arg val ala ala arg 

ggc aac teg gec ggt ctg gee 
gly asn ser ala gly leu ala 

gtg acc tgc egg ccg gac age 
val thr cys arg pro asp ser 

cga tat ggc cgt ttg gac gga 
arg tyr gly arg leu asp gly 

acc gag atg gec gtc gag gac 
thr glu met ala val glu asp 

ctg gtg tgt egg gcg gee gga 
leu val cys arg ala ala gly 

ctg gtg teg tec gtt cgc ggc 
leu val ser ser val arg gly 

teg aag gcg ggc acc gat ctg 
ser lys ala gly thr asp leu 

att egg gtg aac gcg ctg gcg 
ile arg val asn ala leu ala 

acc gac gat ccg aag ggc egg 
thr asp asp pro lys gly arg 

cgc ttc gee gaa ccg gaa gac 
arg phe ala glu pro glu asp 

age ttc tac acc ggc cag gtg 
ser phe tyr thr gly gin val 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



161/185 



ORF d'apres Cole et al., 1998 (Nature 393: 537-544) et contenant la sequence 
codante Rvl714: 



24/1 

tag gtg gag gaa atg gcg ctg 
AMB val glu glu met ala leu 
84/21 

gtg cag gac aag teg ate ctg 
val gin asp lys ser ile leu 
144/41 

egg gcg ctg gec gac gcg gga 
arg ala leu ala asp ala gly 
204/61 

gec gag ctg gtc aac ggc gec 
ala glu leu val asn gly ala 
264/81 

age ctg gee gat gec cag cag 
ser leu ala asp ala gin gin 
324/101 

gga gtg ttg gtg gec teg ggc 
gly val leu val ala ser gly 
384/121 

gac ttc gac get gtg atg gac 
asp phe asp ala val met asp 
444/141 

gga egg gtg ctg etc gag cag 
gly arg val leu leu glu gin 
504/161 

ggc ggg ttg ggc aat gec gee 
gly gly leu gly asn ala ala 
564/181 

ctg ttg gee aag aca ttg gcg 
leu leu ala lys thr leu ala 
624/201 

gcg ccg acg gtg ttt egg tec 
ala pro thr val phe arg ser 
684/221 

egg gec acc egg gag gcg atg 
arg ala thr arg glu ala met 
744/241 

gac ttc gtc ggc gee ctg ate 
asp phe val gly ala leu ile 
804/261 

gtg atg tat ctg gac ggc ggg 
val met tyr leu asp gly gly 



54/11 

get cag cag gtg ccg aac 
ala gin gin val pro asn 

114/31 
ate acc ggc gcg acc ggt 
ile thr gly ala thr gly 

174/51 
gcg egg ctg aca ctg gec 
ala arg leu thr leu ala 

234/71 
ggc ate gac gac gec gec 
gly ile asp asp ala ala 

294/91 
atg gtc gag gcg gca ctg 
met val glu ala ala leu 

354/111 
age aac cat gtg gcg ccc 
ser asn his val ala pro 

414/131 
gcg aac gtg egg ggt gee 
ala asn val arg gly ala 

474/151 
ggt cag ggc ggc age gtg 
gly gin gly gly ser val 

• 534/171 
ggt tac age gcg tac tgc 
gly tyr ser ala tyr cys 

594/191 
gec gaa tgg ggc ggt cac 
ala glu trp gly gly his 

654/211 
gcg gtg acc gag tgg atg 
ala val thr glu trp met 

714/231 
etc gee egg ate ccg ttg 
leu ala arg ile pro leu 

774/251 
tat ctg etc age gac gec 
tyr leu leu ser asp ala 

834/271 
tac acc gca tgc tga 
tyr thr ala cys OPA 



SEQ ID N° 47F 
FIGURE 47F 



ctg ggt ctg gcg cgc ttc age 
leu gly leu ala arg phe ser 

teg ttg ggc cga gtt gec gec 
ser leu gly arg val ala ala 

ggc ggc aac teg gee ggt ctg 
gly gly asn ser ala gly leu 

gtc gtg acc tgc egg ccg gac 
val val thr cys arg pro asp 

ggc cga tat ggc cgt ttg gac 
gly arg tyr gly arg leu asp 

att acc gag atg gee gtc gag 
ile thr glu met ala val glu 

tgg ctg gtg tgt egg gcg gec 
trp leu val cys arg ala ala 

gtg ctg gtg teg tec gtt cgc 
val leu val ser ser val arg 

ccg teg aag gcg ggc acc gat 
pro ser lys ala gly thr asp 

ggc att egg gtg aac gcg ctg 
gly ile arg val asn ala leu 

ttc acc gac gat ccg aag ggc 
phe thr asp asp pro lys gly 

cgc cgc ttc gec gaa ccg gaa 
arg arg phe ala glu pro glu 

teg age ttc tac acc ggc cag 
ser ser phe tyr thr gly gin 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCI7FR98/01813 



162/185 



1/1 31/11 

agg etc atg age aag acg gtt etc ate ctt ggc gcg ggt gtc ggc ggc ctg acc acc gec 

arg leu met ser lys thr val leu ile leu gly ala gly val gly gly leu thr thr ala 
61/21 91/31 

gac acc etc cgt caa ctg eta cca cct gag gat c 

asp thr leu arg gin leu leu pro pro glu asp 



SEQ ID N° 48A 
FIGURE 48A 



1/1 

ggc tea tga gca aga egg ttc 

gly ser OPA ala arg arg phe 
61/21 

aca ccc tec gtc aac tgc tac 

thr pro ser val asn cys tyr 



31/11 

tea tec ttg gcg egg gtg 
ser ser leu ala arg val 

91/31 
cac ctg agg ate 
his leu arg ile 



SEQ ID N° 48B 
FIGURE 48B 



teg gcg gee tga cca ccg ccg 
ser ala ala OPA pro pro pro 



1/1 31/11 

get cat gag caa gac ggt tct cat cct tgg cgc ggg tgt egg egg cct gac cac cgc cga 
ala his glu gin asp gly ser his pro trp arg gly cys arg arg pro asp his arg arg 
61/21 

cac cct ccg tea act get acc acc tga gga tc 
his pro pro ser thr ala thr thr OPA gly 



SEQ ID N° 48C 
FIGURE 48C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



163/185 



Sequence codante Rv0331 predite par Cole et al., 1998 (Nature 393: 537-544) et contenant 
seq4 8A: 

1/1 31/11 

atg age aag acg gtt etc ate ctt ggc gcg ggt gtc ggc ggc ctg acc acc gec gac acc 
Met ser lys thr val leu ile leu gly ala gly val gly gly leu thr thr ala asp thr 
61/21 91/31 

etc cgt caa ctg eta cca cct gag gat cga ate ata ttg gtg gac agg age ttt gac ggg 
leu arg gin leu leu pro pro glu asp arg ile ile leu val asp arg ser phe asp gly 
121/41 151/51 

acg ctg ggc ttg teg ttg eta tgg gtg ttg egg ggc tgg egg egg cct gac gac gtc cgc 
thr leu gly leu ser leu leu trp val leu arg gly trp arg arg pro asp asp val arg 
181/61 211/71 

gtc cgc ccc acc gcg gcg teg ctg ccc ggt gtg gaa atg gtt act gca acc gtc gee cac 
val arg pro thr ala ala ser leu pro gly val glu met val thr ala thr val ala his 
241/81 271/91 

att gac ate gcg gec cag gta gtg cac acc gac aac age gtc ate ggc tat gac gcg ttg 
ile asp ile ala ala gin val val his thr asp asn ser val ile gly tyr asp ala leu 
301/101 331/111 

gtg ate gca tta ggt gcg gcg ctg aac acc gac gec gtt ccc gga ctg teg gac gcg etc 
val ile ala leu gly ala ala leu asn thr asp ala val pro gly leu ser asp ala leu 
361/121 391/131 

gac gee gac gtc gcg ggc cag ttc tac acc ctg gac ggc gcg get gag ctg cgt gcg aag 
asp ala asp val ala gly gin phe tyr thr leu asp gly ala ala glu leu arg ala lys 
421/141 451/151 

gtc gag gcg etc gag cat ggc egg ate get gtg get ate gec ggg gtg ccg ttc aaa tgc 
val glu ala leu glu his gly arg ile ala val ala ile ala gly val pro phe lys cys 
481/161 511/171 

cca gec gca ccg ttc gaa gcg gcg ttt ctg ate gec gee caa etc ggt gac cgc tac gee 
pro ala ala pro phe glu ala ala phe leu ile ala ala gin leu gly asp arg tyr ala 
541/181 571/191 

acc gga acc gta cag ate gac acg ttc acg cct gac ccg ctg ccg atg ccc gtt gca ggt 
thr gly thr val gin ile asp thr phe thr pro asp pro leu pro met pro val ala gly 
601/201 6317211 

ccc gag gtc ggc gag get ttg gtc teg atg etc aag gat cac ggt gtc ggc ttc cat cct 
pro glu val gly glu ala leu val ser met leu lys asp his gly val gly phe his pro 
661/221 691/231 

cgc aag gee eta get cgc gtc gat gag gee gca agg acg atg cac ttc ggt gac ggc acg 
arg lys ala leu ala arg val asp glu ala ala arg thr met his phe gly asp gly thr 
721/241 751/251 

tec gaa ccg ttc gat ctg ctt gee gtg gtc ccc ccg cac gtg ccc tec gec gcg gcg egg 
ser glu pro phe asp leu leu ala val val pro pro his val pro ser ala ala ala arg 
781/261 811/271 

tea gcg ggt etc age gaa tec ggg tgg ata ccc gtg gac ccg cgc acc ctg tec act age 
ser ala gly leu ser glu ser gly trp ile pro val asp pro arg thr leu ser thr ser 
841/281 871/291 

gec gac aac gtg tgg gec ate ggc gat gcg acc gtg ctg acg ctg ccg aat ggc aaa ccg 
ala asp asn val trp ala ile gly asp ala thr val leu thr leu pro asn gly lys pro 
901/301 931/311 

ctg ccc aag get gec gtg ttc gee gaa gee cag gee gca gtt gtc gee cac ggc gtc gec 
leu pro lys ala ala val phe ala glu ala gin ala ala val val ala his gly val ala 
961/321 991/331 

cgc cat etc ggt tac gac gta get gag cgc cac ttc acc ggc acg ggc gee tgc tac gtc 
arg his leu gly tyr asp val ala glu arg his phe thr gly thr gly ala cys tyr val 
1021/341 1051/351 

gag acc ggt gat cac cag gca gee aag ggc gac ggc gat ttc ttc get ccg teg gcg ccc 
glu thr gly asp his gin ala ala lys gly asp gly asp phe phe ala pro ser ala pro 
1081/361 1111/371 

teg gtg acg ctg tac ccg ccg teg egg gag ttt cac gag gag aag gtc gca caa gaa ctg 
ser val thr leu tyr pro pro ser arg glu phe his glu glu lys val ala gin glu leu 
1141/381 

gec tgg ctg acc cgc tgg aag acg tga 
ala trp leu thr arg trp lys thr OPA 



SEQ ID N° 48D 
FEUILLE DE REMfi^fp^REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



164/185 



ORF d'apr£s Cole et al,, 1998 (Nature 393: 537-544) et contenant la sequence 
codante Rv0331: 



1/1 

tga aca ccc gcg ccg acg egg cga caa teg 
OPA thr pro ala pro thr arg arg gin ser 
61/21 

cca tgg gee gat aat agt ttg act gac teg 
pro trp ala asp asn ser leu thr asp ser 
121/41 

gcg gcg gaa tct aat att cca aag ata tat 
ala ala glu ser asn ile pro lys ile tyr 
181/61 

age aag acg gtt etc ate ctt ggc gcg ggt 
ser lys thr val leu ile leu gly ala gly 
241/81 

cgt caa ctg eta cca cct gag gat cga ate 
arg gin leu leu pro pro glu asp arg ile 
301/101 

ctg ggc ttg teg ttg eta tgg gtg ttg egg 
leu gly leu ser leu leu trp val leu arg 
361/121 

cgc ccc ace gcg gcg teg ctg ccc ggt gtg 
arg pro thr ala ala ser leu pro gly val 
421/141 

gac ate gcg gee cag gta gtg cac ace gac 
asp ile ala ala gin val val his thr asp 
481/161 

ate gca tta ggt gcg gcg ctg aac acc gac 
ile ala leu gly ala ala leu asn thr asp 
541/181 

gec gac gtc *gcg ggc cag ttc tac acc ctg 
ala asp val ala gly gin phe tyr thr leu 
601/201 

gag gcg etc gag cat ggc egg ate get gtg 
glu ala leu glu his gly arg ile ala val 
661/221 

gee gca ccg ttc gaa gcg gcg ttt ctg ate 
ala ala pro phe glu ala ala phe leu ile 
721/241 

gga acc gta cag ate gac acg ttc acg cct 
gly thr val gin ile asp thr phe thr pro 
781/261 

gag gtc ggc gag get ttg gtc teg atg etc 
glu val gly glu ala leu val ser met leu 
841/281 

aag gee eta get cgc gtc gat gag gec gca 
lys ala leu ala arg val asp glu ala ala 



31/11 

egg aaa acc ggt ccg egg gaa tgc tgc ggg 
arg lys thr gly pro arg glu cys cys gly 
91/31 

gtc agt cac ccc aag acc ttg cgc aag act 
val ser his pro lys thr leu arg lys thr 
151/51 

gga act cga tgc gaa gga ate agg etc atg 
gly thr arg cys glu gly ile arg leu met 
211/71 

gtc ggc ggc ctg acc acc gee gac acc etc 
val gly gly leu thr thr ala asp thr leu 
271/91 

ata ttg gtg gac agg age ttt gac ggg acg 
ile leu val asp arg ser phe asp gly thr 
331/111 

ggc tgg egg egg cct gac gac gtc cgc gtc 
gly trp arg arg pro asp asp val arg val 
391/131 

gaa atg gtt act gca acc gtc gec cac att 
glu met val thr ala thr val ala his ile 
451/151 

aac age gtc ate ggc tat gac gcg ttg gtg 
asn ser val ile gly tyr asp ala leu val 
511/171 

gee gtt ccc gga ctg teg gac gcg etc gac 
ala val pro gly leu ser asp ala leu aso 
571/191 

gac ggc gcg get gag ctg cgt gcg aag gtc 
asp gly ala ala glu leu arg ala lys val 
631/211 

get ate gee ggg gtg ccg ttc aaa tgc cca 
ala ile ala gly val pro phe lys cys pro 
691/231 

gee gee caa etc ggt gac cgc tac gec acc 
ala ala gin leu gly asp arg tyr ala thr 
751/251 

gac ccg ctg ccg atg ccc gtt gca ggt ccc 
asp pro leu pro met pro val ala gly pro 
811/271 

aag gat cac ggt gtc ggc ttc cac cct cgc 
lys asp his gly val gly Dhe his pro arg 
871/291 

agg acg atg cac ttc ggt gac ggc acg tec 
arg thr met his phe gly asp gly thr ser 



SEQ ID N° 4BF 
FIGURE 48F 

FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCI7FR98/01813 



165/185 



901/301 

gaa ccg ttc gat ctg ctt gcc gtg gtc ccc 
glu pro phe asp leu leu ala val val pro 
961/321 

gcg ggt etc age gaa tec ggg tgg ata ccc 
ala gly leu ser glu ser gly trp ile pro 
1021/341 

gac aac gtg tgg gcc ate ggc gat gcg acc 
asp asn val trp ala ile gly asp ala thr 
1081/361 

ccc aag get gcc gtg ttc gcc gaa gcc cag 
pro lys ala ala val phe ala glu ala gin 
1141/381 

cat etc ggt tac gac gta get gag cgc cac 
his leu gly tyr asp val ala glu arg his 
1201/401 

acc ggt gat cac cag gca gcc aag ggc gac 
thr gly asp his gin ala ala lys gly asp 
1261/421 

gtg acg ctg tac ccg ccg teg egg gag ttt 
val thr leu tyr pro pro ser arg glu phe 
1321/441 

tgg ctg acc cgc tgg aag acg tga 
trp leu thr arg trp lys thr OPA 



931/311 
















ccg cac gtg 


ccc 


tec 


gcc 


gcg 


gcg 


egg 


tea 


pro his val 


pro 


ser 


ala 


ala 


ala 


arg 


ser 


991/331 
















gtg gac ccg 


cgc 


acc 


ctg 


tec 


act 


age 


gcc 


val asp pro 


arg 


thr 


leu 


ser 


thr 


ser 


ala 


1051/351 
















gtg ctg acg 


ctg 


ccg 


aat 


ggc 


aaa 


ccg 


ctg 


val leu thr 


leu 


pro 


asn 


gly 


lys 


pro 


leu 


1111 /m 
1111/ J / 1 
















gcc gca gtt 


gtc 


gcc 


cac 


ggc 


gtc 


gcc 


cgc 


ala ala val 


val 


ala 


nis 


gly 


val 


ala 


arg 


1171/391 














ttc acc ggc 


acg 


ggc 


gcc 


tgc 


tac 


gtc 


gag 


phe thr gly 


thr 


gly 


ala 


cys 


tyr 


val 


glu 


1231/411 
















ggc gat ttc 


ttc 


get 


ccg 


teg 


gcg 


ccc 


teg 


gly asp phe 


phe 


ala 


pro 


ser 


ala 


pro 


ser 


1291/431 
















cac gag gag 


aag 


gtc 


gca 


caa 


gaa 


ctg 


gcc 


his glu glu 


lys 


val 


ala 


gin 


glu 


leu 


ala 
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Fragment amplifi6 par PGR d'apres les similarities de sequences avec une serine 
protease de la famille htrA de E. coli (creation du site BamHI a l'extremite 5* 
et du site SnaBI a l'extremite 3 1 ) et sous-clone dans le vecteur pJVED: 

1/1 31/11 

cca tct aca ccg etc aac age egg gec aga cgc tgc egg teg gtg ctg ccg aga agg egg 
pro ser thr pro leu asn ser arg ala arg arg cys arg ser val leu pro arg arg arg 
61/21 91/31 

tga tec gtg gcg agt tgt tea tgt cgc ggc gca cca ccg ccg ace aac ggg tgc ttg cca 
OPA ser val ala ser cys ser cys arg gly ala pro pro pro thr asn gly cys leu pro 
121/41 151/51 

tec gtc tga cca acg gta gtt cgc tgc tga tct cca aaa gtc tea age cca ccg aag cag 
ser val OPA pro thr val val arg cys OPA ser pro lys val ser ser pro pro lys gin 
181/61 211/71 

tea tga aca age tgc gtt ggg tgc tat tga teg tgg gtg gga teg ggg tgg egg teg ccg 
ser OPA thr ser cys val gly cys tyr OPA ser trp val gly ser gly trp arg ser pro 
241/81 271/91 

egg tgg ccg ggg gga tgg tea ccc ggg ccg ggc tga ggc egg tgg gee gec tea ccg aag 
arg trp pro gly gly trp ser pro gly pro gly OPA gly arg trp ala ala ser pro lys 
301/101 331/111 

egg ccg age ggg tgg cgc gaa ccg acg ace tgc ggc cca tec ccg tct teg gca gcg acg 
arg pro ser gly trp arg glu pro thr thr cys gly pro ser pro ser ser ala ala thr 
361/121 391/131 

aat tgg cca ggc tga cag agg cat tea att taa tgc tgc ggg cgc tgg ccg agt cac ggg 
asn trp pro gly OPA gin arg his ser ile OCH cys cys gly arg trp pro ser his gly 
421/141 451/151 

aac ggc agg caa ggc tgg tta ccg acg ccg gac atg aat tgc gta ccc cgc taa cgt cgc 
asn gly arg gin gly trp leu pro thr pro asp met asn cys val pro arg OCH arg arg 
481/161 . 511/171 

tgc gca cca atg teg aac tct tga tgg cct cga tgg ccc egg ggg etc cgc ggc tac cca 
cys ala pro met ser asn ser OPA trp pro arg trp pro arg gly leu arg gly tyr pro 
541/181 571/191 

age agg aga tgg teg ace tgc gtg ccg atg tgc tgg etc aaa teg agg aat tgt cca cac 
ser arg arg trp ser thr cys val pro met cys trp leu lys ser arg asn cys oro his 
601/201 631/211 

tgg tag gcg att tgg tgg ace tgt ccc gag gcg acg ccg gag aag tgg tgc acg age egg 
trp AMB ala ile trp trp thr cys pro glu ala thr pro glu lys trp cys thr ser arg 
661/221 691/231 

teg aca tgg ctg acg teg teg ace gca gee tgg age ggg tea ggc ggc ggc gca acg ata 
ser thr trp leu thr ser ser thr ala ala trp ser gly ser gly gly gly ala thr ile 
721/241 751/251 

tec ttt teg acg teg agg tga ttg ggt ggc agg ttt atg gcg ata ccg ctg gat tgt cgc 
ser phe ser thr ser arg OPA leu gly gly arg phe met ala ile pro leu asp cys arg 
781/261 811/271 

gga tgg cgc tta ace tga tgg aca acg ccg cga agt gga gec cgc egg gcg gee acg tgg 
gly trp arg leu thr OPA trp thr thr pro arg ser gly ala arg arg ala ala thr trp 
841/281 871/291 

gtg tea ggc tga gee age teg acg cgt cgc acg ctg age tgg tgg ttt ccg acc gcg gec 
val ser gly OPA ala ser ser thr arg arg thr leu ser trp trp phe pro thr ala ala 
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901/301 

egg gca ttc ccg tgc agg age gec gtc tgg 
arg ala phe pro cys arg ser ala val trp 
961/321 

cac ggg cgt tgc egg gtt egg gec teg ggt 
his gly arg cys arg val arg ala ser gly 
1021/341 

acg gcg gat tgc tgc gca teg aag aca ccg 
thr ala asp cys cys ala ser lys thr pro 
1081/361 

ttt acg tgc tgc tec ccg gec gtc gga tgc 
phe thr cys cys ser pro ala val gly cys 
1141/381 

gcg etc gga gca egg aca teg aga act etc 
ala leu gly ala arg thr ser arg thr leu 
1201/401 

etc agt cca cgc gcg caa cct agt tgt gca 
leu ser pro arg ala gin pro ser cys ala 
1261/421 

cca cgc atg gee aag ttg gee cga gta gtg 
pro arg met ala lys leu ala arg val val 
1321/441 

atg acg aat cac cca egg tat teg cca ccg 
met thr asn his pro arg tyr ser pro pro 
1381/461 

cag ggg cag cag caa acg tac age cag cag 
gin gly gin gin gin thr tyr ser gin gin 
1441/481 

ccg cag cca ace cag tac cgt caa ccc tac 
pro gin pro thr gin tyr arg gin pro tyr 
1501/501 

ata cct ggc gtg att ccg ace atg acg ccc 
ile pro gly val ile pro thr met thr pro 
1561/521 

gca ggc atg ttg gee ate ggc gcg gtg acg 
ala gly met leu ala ile gly ala val thr 
1621/541 

gcg gee gca tec ctg gtc ggg ttc aac egg 
ala ala ala ser leu val gly phe asn arg 
1681/561 

get gee age gcg gcg cca age ate ccc gca 
ala ala ser ala ala pro ser ile pro ala 
1741/581 

gtg gcg gec aag gtg gtg ccc agt gtc gtc 
val ala ala lys val val pro ser val val 
1801/601 

gag gag ggc tec ggc ate att ctg tct gec 
glu glu gly ser gly ile ile leu ser ala 
1861/621 

ate gcg gcg gec gee aag cct ccc ctg ggc 
ile ala ala ala ala lys pro pro leu gly 



931/311 

tgt ttg aac ggt ttt ace ggt egg cat egg 
cys leu asn gly phe thr gly arg his arg 
991/331 

tgg cga teg tea aac agg tgg tgc tea acc 
trp arg ser ser asn arg trp cys ser thr 
1051/351 

acc cag gcg gee age ccc ctg gaa cgt cga 
thr gin ala ala ser pro leu glu arg arg 
1111/371 

cga ttc cgc age ttc ccg gtg cga egg ctg 
arg phe arg ser phe pro val arg arg leu 
1171/391 

ggg gtt egg cga acg tta tct cag tgg aat 
gly val arg arg thr leu ser gin trp asn 
1231/411 

gtt act gtt gaa age cac acc cat gee agt 
val thr val glu ser his thr his ala ser 
1291/431 

ggc eta gta cag gaa gag caa cct age gac 
gly leu val gin glu glu gin pro ser asp 
1351/451 

ccg cag cag ccg gga acc cca ggt tat get 
pro gin gin pro gly thr pro gly tyr ala 
1411/471 

ttc gac tgg cgt tac cca ccg tec ccg ccc 
phe asp trp arg tyr pro pro ser pro pro 
1471/491 

gag gcg ttg ggt ggt acc egg ccg ggt ctg 
glu ala leu gly gly thr arg pro gly leu 
1531/511 

cct cct ggg atg gtt cgc caa cgc cct cgt 
pro pro gly met val arg gin arg pro arg 
1591/531 

ata gcg gtg gtg tec gee ggc ate ggc ggc 
ile ala val val ser ala gly ile gly gly 
1651/551 

gca ccc gee ggc ccc age ggc ggc cca gtg 
ala pro ala gly pro ser gly gly pro val 
1711/571 

gca aac atg ccg ccg ggg teg gtc gaa cag 
ala asn met pro pro gly ser val glu gin 
1771/591 

atg ttg gaa acc gat ctg ggc cgc cag teg 
met leu glu thr asp leu gly arg gin ser 
1831/611 

gag ggg ctg ate ttg acc aac aac cac gtg 
glu gly leu ile leu thr asn asn his val 
1891/631 

agt ccg ccg ccg aaa acg acg gta 
ser pro pro pro lys thr thr val 
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1/1 

cat eta cac cgc tea 
his leu his arg ser 
61/21 

gat ccg tgg cga gtt 
asp pro trp arg val 
121/41 

ccg tct gac caa egg 
pro ser asp gin arg 
181/61 

cat gaa caa get gcg 
his glu gin ala ala 
241/81 

ggt ggc egg ggg gat 

giy giy ar g giy asp 

301/101 

ggc cga gcg ggt ggc 
gly arg ala gly gly 
361/121 

att ggc cag get gac 
ile gly gin ala asp 
421/141 

acg gca ggc aag get 
thr ala gly lys ala 
481/161 

gcg cac caa tgt cga 
ala his gin cys arg 
541/181 

gca gga gat ggt cga 
ala gly asp gly arg 
601/201 

ggt agg cga ttt ggt 
gly arg arg phe gly 
661/221 

cga cat ggc tga cgt 
arg his gly OPA arg 
721/241 

cct ttt cga cgt cga 
pro phe arg arg arg 
781/261 

gat ggc get taa cct 
asp gly ala OCH pro 
841/281 

tgt cag get gag cca 
cys gin ala glu pro 
901/301 

ggg cat tec cgt gca 
gly his ser arg ala 
961/321 

acg ggc gtt gec ggg 
thr gly val ala gly 
1021/341 

egg egg att get gcg 
arg arg ile ala ala 



aca gec ggg cca gac 
thr ala gly pro asp 

gtt cat gtc gcg gcg 
val his val ala ala 

tag ttc get get gat 
AMB phe ala ala asp 

ttg ggt get att gat 
leu gly ala ile asp 

ggt cac ccg ggc egg 
gly his pro gly arg 

gcg aac cga cga cct 
ala asn arg arg pro 

aga ggc att caa ttt 
arg gly ile gin phe 

ggt tac cga cgc egg 
gly tyr arg arg arg 

act ctt gat ggc etc 
thr leu asp gly leu 

cct gcg tgc cga tgt 
pro ala cys arg cys 

gga cct gtc ccg agg 
gly pro val pro arg 

cgt cga ccg cag cct 
arg arg pro gin pro 

ggt gat tgg gtg gca 
gly asp trp val ala 

gat gga caa cgc cgc 
asp gly gin arg arg 

get cga cgc gtc gca 
ala arg arg val ala 

gga gcg ccg tct ggt 
gly ala pro ser gly 

ttc ggg cct egg gtt 
phe gly pro arg val 

cat cga aga cac cga 
his arg arg his arg 



31/11 

get gee ggt egg tgc 
ala ala gly arg cys 
91/31 

cac cac cgc cga cca 
his his arg arg pro 
151/51 

etc caa aag tct caa 
leu gin lys ser gin 
211/71 

cgt ggg tgg gat egg 
arg gly trp asp arg 
271/91 

get gag gee ggt ggg 
ala glu ala gly gly 
331/111 

gcg gec cat ccc cgt 
ala ala his pro arg 
391/131 

aat get gcg ggc get 
asn ala ala gly ala 
451/151 

aca tga att gcg tac 
thr OPA ile ala tyr 
511/171 

gat ggc ccc ggg ggc 
asp gly pro gly gly 
571/191 

get ggc tea aat cga 
ala gly ser asn arg 
631/211 

cga cgc egg aga agt 
arg arg arg arg ser 
691/231 

gga gcg ggt cag gcg 
gly ala gly gin ala 
751/251 

ggt tta tgg cga tac 
gly leu trp arg tyr 
811/271 

gaa gtg gag ccc gee 
glu val glu pro ala 
871/291 

cgc tga get ggt ggt 
arg OPA ala gly gly 
931/311 

gtt tga acg gtt tta 
val OPA thr val leu 
991/331 

ggc gat cgt caa aca 
gly asp arg gin thr 
1051/351 

ccc agg egg cca gec 
pro arg arg pro ala 



tgc cga gaa ggc ggt 
cys arg glu gly gly 

acg ggt get tgc cat 
thr gly ala cys his 

gee cac cga age agt 
ala his arg ser ser 

ggt ggc ggt cgc cgc 
gly gly gly arg arg 

ccg cct cac cga age 
pro pro his arg ser 

ctt egg cag cga cga 
leu arg gin arg arg 

ggc cga gtc acg gga 
gly arg val thr gly 

ccc get aac gtc get 
pro ala asn val ala 

tec gcg get acc caa 
ser ala ala thr gin 

gga att gtc cac act 
gly ile val his thr 

ggt gca cga gee ggt 
gly ala arg ala gly 

gcg gcg caa cga tat 
ala ala gin arg tyr 

cgc tgg att gtc gcg 
arg trp ile val ala 

ggg egg cca cgt ggg 
gly arg pro arg gly 

ttc cga ccg egg ccc 
phe arg pro arg pro 

ccg gtc ggc ate ggc 
pro val gly ile gly 

ggt ggt get caa cca 
gly gly ala gin pro 

ccc tgg aac gtc gat 
pro trp asn val asp 
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1081/361 

tta cgt get get ccc 
leu arg ala ala pro 
1141/381 

cgc teg gag cac gga 
arg ser glu his gly 
1201/401 

tea gtc cac gcg cgc 
ser val his ala arg 
1261/421 

cac gca tgg cca agt 
his ala trp pro ser 
1321/441 

tga cga ate acc cac 
OPA arg ile thr his 
1381/461 

agg ggc age age aaa 
arg gly ser ser lys 
'1441/481 

cgc age caa ccc agt 
arg ser gin pro ser 
1501/501 

tac ctg gcg tga ttc 
tyr leu ala OPA phe 
1561/521 

cag gca tgt tgg cca 
gin ala cys trp pro 
1621/541 

egg ccg cat ccc tgg 
arg pro his pro trp 
1681/561 

ctg cca gcg egg cgc 
leu pro ala arg arg 
1741/581 

tgg egg cca agg tgg 
trp arg pro arg trp 
1801/601 

agg agg get ccg gca 
arg arg ala pro ala 
1861/621 

teg egg egg ccg cca 
ser arg arg pro pro 



egg ccg teg gat gec 
arg pro ser asp ala 

cat cga gaa etc teg 
his arg glu leu ser 

aac eta gtt gtg cag 
asn leu val val gin 

tgg ccc gag tag tgg 
trp pro glu AMB trp 

ggt att cgc cac cgc 
gly ile arg his arg 

cgt aca gee age agt 
arg thr ala ser ser 

acc gtc aac cct acg 
thr val asn pro thr 

cga cca tga cgc ccc 
arg pro OPA arg pro 

teg gcg egg tga cga 
ser ala arg OPA arg 

teg ggt tea acc ggg 
ser gly ser thr gly 

caa gca tec ccg cag 
gin ala ser pro gin 

tgc cca gtg teg tea 
cys pro val ser ser 

tea ttc tgt ctg ccg 
ser phe cys leu pro 

age etc ccc tgg gca 
ser leu pro trp ala 



1111/371 

gat tec gca get tec 
asp ser ala ala ser 
1171/391 

ggg ttc ggc gaa cgt 
gly phe gly glu arg 
1231/411 

tta ctg ttg aaa gee 
leu leu leu lys ala 
1291/431 

gee tag tac agg aag 
ala AMB tyr arg lys 
1351/451 

cgc age age egg gaa 
arg ser ser arg glu 
1411/471 

teg act ggc gtt acc 
ser thr gly val thr 
1471/491 

agg cgt tgg gtg gta 
arg arg trp val val 
1531/511 

etc ctg gga tgg ttc 
leu leu gly trp phe 
1591/531 

tag egg tgg tgt ccg 
AMB arg trp cys pro 
1651/551 

cac ccg ccg gec cca 
his pro pro ala pro 
1711/571 

caa aca tgc cgc egg 
gin thr cys arg arg 
1771/591 

tgt tgg aaa ccg ate 
cys trp lys pro ile 
1831/611 

agg ggc tga tct tga 
arg gly OPA ser OPA 
1891/631 

gtc cgc cgc cga aaa 
val arg arg arg lys 



egg tgc gac ggc tgg 
arg cys asp gly trp 

tat etc agt gga ate 
tyr leu ser gly ile 

aca ccc atg cca gtc 
thr pro met pro val 

age aac eta gcg aca 
ser asn leu ala thr 

ccc cag gtt atg etc 
pro gin val met leu 

cac cgt ccc cgc ccc 
his arg pro arg pro 

ccc ggc egg gtc tga 
pro gly arg val OPA 

gee aac gec etc gtg 
ala asn ala leu val 

ccg gca teg gcg gcg 
pro ala ser ala ala 

gcg gcg gec cag tgg 
ala ala ala gin trp 

ggt egg teg aac agg 
gly arg ser asn arg 

tgg gec gee agt egg 
trp ala ala ser arg 

cca aca acc acg tga 
pro thr thr thr OPA 

cga egg ta 
arg arg 
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1/1 

ate tac acc get 
ile tyr thr ala 
61/21 

ate cgt ggc gag 
ile arg gly glu 
121/41 

cgt ctg acc aac 
arg leu thr asn 
181/61 

atg aac aag ctg 
met asn lys leu 
241/81 

gtg gee ggg ggg 
val ala gly gly 
301/101 

gec gag egg gtg 
ala glu arg val 
361/121 

ttg gec agg ctg 
leu ala arg leu 
421/141 

egg cag gca agg 
arg gin ala arg 
481/161 

cgc acc aat gtc 
arg thr asn val 
541/181 

cag gag atg gtc 
gin glu met val 
601/201 

gta ggc gat ttg 
val gly asp leu 
661/221 

gac atg get gac 
asp met ala asp 
721/241 

ctt ttc gac gtc 
leu phe asp val 
781/261 

atg gcg ctt aac 
met ala leu asn 
841/281 

gtc agg ctg age 
val arg leu ser 
901/301 

ggc att ccc gtg 
gly ile pro val 
961/321 

egg gcg ttg ccg 
arg ala leu pro 



caa cag ccg ggc 
gin gin pro gly 

ttg ttc atg teg 
leu phe met ser 

ggt agt teg ctg 
gly ser ser leu 

cgt tgg gtg eta 
arg trp val leu 

atg gtc acc egg 
met val thr arg 

gcg cga acc gac 
ala arg thr asp 

aca gag gca ttc 
thr glu ala phe 

ctg gtt acc gac 
leu val thr asp 

gaa etc ttg atg 
glu leu leu met 

gac ctg cgt gec 
asp leu arg ala 

gtg gac ctg tec 
val asp leu ser 

gtc gtc gac cgc 
val val asp arg 

gag gtg att ggg 
glu val ile gly 

ctg atg gac aac 
leu met asp asn 

cag etc gac gcg 
gin leu asp ala 

cag gag cgc cgt 
gin glu arg arg 

ggt teg ggc etc 
gly ser gly leu 



31/11 
cag acg ctg ccg 
gin thr leu pro 

91/31 
egg cgc acc acc 
arg arg thr thr 

151/51 
ctg ate tec aaa 
leu ile ser lys 

211/71 
ttg ate gtg ggt 
leu ile val gly 

271/91 
gee ggg ctg agg 
ala gly leu arg 
331/111 
gac ctg egg ccc 
asp leu arg pro 
391/131 
aat tta atg ctg 
asn leu met leu 
451/151 
gec gga cat gaa 
ala gly his glu 
511/171 
gee teg atg gec 
ala ser met ala 
. 571/191 
gat gtg ctg get 
asp val leu ala 
631/211 
cga ggc gac gec 
arg gly asp ala 
691/231 
age ctg gag egg 
ser leu glu arg 
751/251 
tgg cag gtt tat 
trp gin val tyr 
811/271 
gee gcg aag tgg 
ala ala lys trp 
871/291 
teg cac get gag 
ser his ala glu 
931/311 
ctg gtg ttt gaa 
leu val phe glu 
991/331 
ggg ttg gcg ate 
gly leu ala ile 



gtc ggt get gec 
val gly ala ala 

gec gac caa egg 
ala asp gin arg 

agt etc aag ccc 
ser leu lys pro 

ggg ate ggg gtg 
gly ile gly val 

ccg gtg ggc cgc 
pro val gly arg 

ate ccc gtc ttc 
ile pro val phe 

egg gcg ctg gec 
arg ala leu ala 

ttg cgt acc ccg 
leu arg thr pro 

ccg ggg get ccg 
pro gly ala pro 

caa ate gag gaa 
gin ile glu glu 

gga gaa gtg gtg 
gly glu val val 

gtc agg egg egg 
val arg arg arg 

ggc gat acc get 
gly asp thr ala 

age ccg ccg ggc 
ser pro pro gly 

ctg gtg gtt tec 
leu val val ser 

egg ttt tac egg 
arg phe tyr arg 

gtc aaa cag gtg 
val lys gin val 



gag aag gcg gtg 
glu lys ala val 

gtg ctt gee ate 
val leu ala ile 

acc gaa gca gtc 
thr glu ala val 

gcg gtc gee gcg 
ala val ala ala 

etc acc gaa gcg 
leu thr glu ala 

ggc age gac gaa 
gly ser asp glu 

gag tea egg gaa 
glu ser arg glu 

eta acg teg ctg 
leu thr ser leu 

egg eta ccc aag 
arg leu pro lys 

ttg tec aca ctg 
leu ser thr leu 

cac gag ccg gtc 
his glu pro val 

cgc aac gat ate 
arg asn asp ile 

gga ttg teg egg 
gly leu ser arg 

ggc cac gtg ggt 
gly his val gly 

gac cgc ggc ccg 
asp arg gly pro 

teg gca teg gca 
ser ala ser ala 

gtg etc aac cac 
val leu asn his 
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1021/341 

ggc gga ttg ctg cgc 
gly gly leu leu arg 
1081/361 

tac gtg ctg etc ccc 
tyr val leu leu pro 
1141/381 

get egg age acg gac 
ala arg ser thr asp 
1201/401 

cag tec acg cgc gca 
gin ser thr arg ala 
1261/421 

acg cat ggc caa gtt 
thr his gly gin val 
1321/441 

gac gaa tea ccc acg 
asp glu ser pro thr 
1381/461 

ggg gca gca gca aac 
gly ala ala ala asn 
1441/481 

gca gec aac cca gta 
ala ala asn pro val 
1501/501 

acc tgg cgt gat tec 
thr trp arg asp ser 
1561/521 

agg cat gtt ggc cat 
arg his val gly his 
1621/541 

ggc cgc ate cct ggt 
gly arg ile pro gly 
1681/561 

tgc cag cgc ggc gec 
cys gin arg gly ala 
1-741/581 

ggc ggc caa ggt ggt 
gly gly gin gly gly 
1801/601 

gga ggg etc egg cat 
gly gly leu arg his 
1861/621 

cgc ggc ggc cgc caa 
arg gly gly arg gin 



ate gaa gac acc gac 
ile glu asp thr asp 

ggc cgt egg atg ccg 
gly arg arg met pro 

ate gag aac tct egg 
ile glu asn ser arg 

acc tag ttg tgc agt 
thr AMB leu cys ser 

ggc ccg agt agt ggg 
gly pro ser ser gly 

gta ttc gee acc gec 
val phe ala thr ala 

gta cag cca gca gtt 
val gin pro ala val 

ccg tea acc eta cga 
pro ser thr leu arg 

gac cat gac gec ccc 
asp his asp ala pro 

egg cgc ggt gac gat 
arg arg gly asp asp 

egg gtt caa ccg ggc 
arg val gin pro gly 

aag cat ccc cgc age 
lys his pro arg ser 

gee cag tgt cgt cat 
ala gin cys arg his 

cat tct gtc tgc cga 
his ser val cys arg 

gee tec cct ggg cag 
ala ser pro gly gin 



1051/351 

cca ggc ggc cag ccc 
pro gly gly gin pro 
1111/371 

att ccg cag ctt ccc 
ile pro gin leu pro 
1171/391 

ggt teg gcg aac gtt 
gly ser ala asn val 
1231/411 

tac tgt tga aag cca 
tyr cys OPA lys pro 
1291/431 

cct agt aca gga aga 
pro ser thr gly arg 
1351/451 

gca gca gec ggg aac 
ala ala ala gly asn 
1411/471 

cga ctg gcg tta ccc 
arg leu ala leu pro 
1471/491 

ggc gtt ggg tgg tac 
gly val gly trp tyr 
1531/511 

tec tgg gat ggt teg 
ser trp asp gly ser 
1591/531 

age ggt ggt gtc cgc 
ser gly gly val arg 
1651/551 

acc cgc egg ccc cag 
thr arg arg pro gin 
1711/571 

aaa cat gee gec ggg 
lys his ala ala gly 
1771/591 

gtt gga aac cga tct 
val gly asn arg ser 
1831/611 

ggg get gat ctt gac 
gly ala asp leu asp 
1891/631 

tec gee gec gaa aac 
ser ala ala glu asn 



cct gga acg teg att 
pro gly thr ser ile 

ggt gcg acg get ggc 
gly ala thr ala gly 

ate tea gtg gaa tct 
ile ser val glu ser 

cac cca tgc cag tec 
his pro cys gin ser 

gca acc tag cga cat 
ala thr AMB arg his 

ccc agg tta tgc tea 
pro arg leu cys ser 

acc gtc ccc gee ccc 
thr val pro ala pro 

ccg gec ggg tct gat 
pro ala gly ser asp 

cca acg ccc teg tgc 
pro thr pro ser cys 

egg cat egg egg cgc 
arg his arg arg arg 

egg egg ccc agt ggc 
arg arg pro ser gly 

gtc ggt cga aca ggt 
val gly arg thr gly 

ggg ccg cca gtc gga 
gly pro pro val gly 

caa caa cca cgt gat 
gin gin pro arg asp 

gac ggt a 
asp gly 



SEQ ID N° 49C (suite 1) 
FIGURE 49C (suite 1) 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



172/185 



Sequence codante Rv0983 predite par Cole et al., 1998 (Nature 393:537-544) et 
contenant seq60A: 

1/1 31/11 

atg gcc aag ttg gcc cga gta gtg ggc eta gta cag gaa gag caa cct age gac atg acg 
Met ala lys leu ala arg val val gly leu val gin glu glu gin pro ser asp met thr 
61/21 91/31 

aat cac cca egg tat teg cca ccg ccg cag cag ccg gga ace cca ggt tat get cag ggg 
asn his pro arg tyr ser pro pro pro gin gin pro gly thr pro gly tyr ala gin gly 
121/41 151/51 

cag cag caa acg tac age cag cag ttc gac tgg cgt tac cca ccg tec ccg ccc ccg cag 
gin gin gin thr tyr ser gin gin phe asp trp arg tyr pro pro ser pro pro pro gin 
181/61 211/71 

cca ace cag tac cgt caa ccc tac gag gcg ttg ggt ggt acc egg ccg ggt ctg ata cct 
pro thr gin tyr arg gin pro tyr glu ala leu gly gly thr arg pro gly leu ile pro 
241/81 271/91 

ggc gtg att ccg acc atg acg ccc cct cct ggg atg gtt cgc caa cgc cct cgt gca ggc 
gly val ile pro thr met thr pro pro pro gly met val arg gin arg pro arg ala gly 
301/101 331/111 

atg ttg gcc ate ggc gcg gtg acg ata gcg gtg gtg tec gcc ggc ate ggc ggc gcg gcc 
met leu ala ile gly ala val thr ile ala val val ser ala gly ile gly gly ala ala 
361/121 391/131 

gca tec ctg gtc ggg ttc aac egg gca ccc gcc ggc ccc age ggc ggc cca gtg get gcc 
ala ser leu val gly phe asn arg ala pro ala gly pro ser gly gly pro val ala ala 
421/141 451/151 

age gcg gcg cca age ate ccc gca gca aac atg ccg ccg ggg teg gtc gaa cag gtg gcg 
ser ala ala pro ser ile pro ala ala asn met pro pro gly ser val glu gin val ala 
481/161 . 511/171 

gcc aag gtg gtg ccc agt gtc gtc atg ttg gaa acc gat ctg ggc cgc cag teg gag gag 
ala lys val val pro ser val val met leu glu thr asp leu gly arg gin ser glu glu 
541/181 571/191 

ggc tec ggc ate att ctg tct gcc gag ggg ctg ate ttg acc aac aac cac gtg ate gcg 
gly ser gly ile ile leu ser ala glu gly leu ile leu thr asn asn his val ile ala 
601/201 631/211 

gcg gcc gcc aag cct ccc ctg ggc agt ccg ccg ccg aaa acg acg gta acc ttc tct gac 
ala ala ala lys pro pro leu gly ser pro pro pro lys thr thr val thr phe ser asp 
661/221 691/231 

ggg egg acc gca ccc ttc acg gtg gtg ggg get gac ccc acc agt gat ate gcc gtc gtc 
gly arg thr ala pro phe thr val val gly ala asp pro thr ser asp ile ala val val 
721/241 751/251 

cgt gtt cag ggc gtc tec ggg etc acc ccg ate tec ctg ggt tec tec teg gac ctg agg 
arg val gin gly val ser gly leu thr pro ile ser leu gly ser ser ser asp leu arg 
781/261 811/271 

gtc ggt cag ccg gtg ctg gcg ate ggg teg ccg etc ggt ttg gag ggc acc gtg acc acg 
val gly gin pro val leu ala ile gly ser pro leu gly leu glu gly thr val thr thr 



SEQ ID N° 49D 
FIGURE 4 9D 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



173/185 



841/281 

ggg ate gtc age get etc aac 
gly ile val ser ala leu asn 
901/301 

ace gtg ctg gac gcc att cag 
thr val leu asp ala ile gin 
961/321 

ctg gtg aac atg aac get caa 
leu val asn met asn ala gin 
1021/341 

gac tea gcc gat gcg cag age 
asp ser ala asp ala gin ser 
1081/361 

gcc aag cgc ate gcc gac gag 
ala lys arg ile ala asp glu 
1141/381 

gtg cag gtg acc aat gac aaa 
val gin val thr asn asp lys 
1201/401 

ggt get gcc gcg aac get gga 
gly ala ala ala asn ala gly 
1261/421 

ccg ate aac age gcg gac gcg 
pro ile asn ser ala asp ala 
1321/441 

gtg gcg eta acc ttt cag gat 
val ala leu thr phe gin asp 
1381/461 

aag gcg gag cag tga 
lys ala glu gin OPA 



871/291 

cgt cca gtg teg acg acc ggc 
arg pro val ser thr thr gly 
931/311 

acc gac gcc gcg ate aac ccc 
thr asp ala ala ile asn pro 
991/331 

etc gtc gga gtc aac teg gcc 
leu val gly val asn ser ala 

1051/351 
ggc teg ate ggt etc ggt ttt 
gly ser ile gly leu gly phe 

1111/371 
ttg ate age acc ggc aag gcg 
leu ile ser thr gly lys ala 

1171/391 
gac acc ctg ggc gcc aag ate 
asp thr leu gly ala lys ile 

1231/411 
gtg ccg aag ggc gtc gtt gtc 
val pro lys gly val val val 

1291/431 
ttg gtt gcc gcc gtg egg tec 
leu val ala ala val arg ser 

1351/451 
ccc teg ggc ggt age cgc aca 
pro ser gly gly ser arg thr 



gag 
glu 


gcc 
ala 


ggc 
gly 


aac 
asn 


cag 
gin 


aac 
asn 


ggt 
gly 


aac 
asn 


tec 
ser 


ggg 

gly 


ggc 
gly 


gcg 

ala 


att 
ile 


gcc 
ala 


acg 
thr 


ctg 
leu 


ggc 
gly 


gcg 
ala 


gcg 
ala 


att 
ile 


cca 
pro 


gtc 
val 


gac 
asp 


cag 
gin 


tea 
ser 


cat 
his 


gcc 
ala 


tec 
ser 


ctg 
leu 


ggt 
gly 


gtc 
val 


gaa 
glu 


gta 
val 


gtg 
val 


gcc 
ala 


ggt 
gly 


acc 
thr 


aag 
lys 


gtc 
val 


gac 
asp 


gac 
asp 


cgc 
arg 


aaa 
lys 


gcg 
ala 


ccg 
pro 


ggc 
gly 


gcc 
ala 


acg 
thr 


gtg 
val 


caa 
gin 


gtc 
val 


acc 
thr 


etc 
leu 


ggc 
gly 



SEQ ID N° 49D (suite 1) 
FIGURE 49D (suite 1) 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



174/185 



ORF d'apres Cole et al., 1998 (Nature 393:537-544) et contenant Rv0983 
1/1 31/11 

tga gcc age teg acg cgt cgc acg ctg age tgg tgg ttt ccg ace gcg gec egg gca ttc 
OPA ala ser ser thr arg arg thr leu ser trp trp phe pro thr ala ala arg ala phe 
61/21 91/31 

ccg tgc agg age gcc gtc tgg tgt ttg aac ggt ttt acc ggt egg cat egg cac ggg cgt 
pro cys arg ser ala val trp cys leu asn gly phe thr gly arg his arg his gly arg 
121/41 151/51 

tgc egg gtt egg gcc teg ggt tgg cga teg tea aac agg tgg tgc tea acc acg gcg gat 
cys arg val arg ala ser gly trp arg ser ser asn arg trp cys ser thr thr ala asp 
181/61 211/71 

tgc tgc gca teg aag aca ccg acc cag gcg gcc age ccc ctg gaa cgt cga ttt acg tgc 
cys cys ala ser lys thr pro thr gin ala ala ser pro leu glu arg arg phe thr cys 
241/81 271/91 

tgc tec ccg gcc gtc gga tgc cga ttc cgc age ttc ccg gtg cga egg ctg gcg etc gga 
cys ser pro ala val gly cys arg phe arg ser phe pro val arg arg leu ala leu gly 
301/101 331/111 

gca egg aca teg aga act etc ggg gtt egg cga acg tta tct cag tgg aat etc agt cca 
ala arg thr ser arg thr leu gly val arg arg thr leu ser gin trp asn leu ser pro 
361/121 391/131 

cgc gcg caa cct agt tgt gca gtt act gtt gaa age cac acc cat gcc agt cca cgc atg 
arg ala gin pro ser cys ala val thr val glu ser his thr his ala ser pro arg met 
421/141 451/151 

gcc aag ttg gcc cga gta gtg ggc eta gta cag gaa gag caa cct age gac atg acg aat 
ala lys leu ala arg val val gly leu val gin glu glu gin pro ser asp met thr asn 
481/161 511/171 

cac cca egg tat teg cca ccg ccg cag cag ccg gga acc cca ggt tat get cag ggg cag 
his pro arg tyr ser pro pro pro gin glo pro gly thr pro gly tyr ala gin gly gin 
541/181 571/191 

cag caa acg tac age cag cag ttc gac tgg cgt tac cca ccg tec ccg ccc ccg cag cca 
gin gin thr tyr ser gin gin phe asp trp arg tyr pro pro ser pro pro pro gin pro 
601/201 631/211 

acc cag tac cgt caa ccc tac gag gcg ttg ggt ggt acc egg ccg ggt ctg ata cct ggc 
thr gin tyr arg gin pro tyr glu ala leu gly gly thr arg pro gly leu ile oro gly 
661/221 691/231 

gtg att ccg acc atg acg ccc cct cct ggg atg gtt cgc caa cgc cct cgt gca ggc atg 
val ile pro thr met thr pro pro pro gly met val arg gin arg pro arg ala gly met 
721/241 751/251 

ttg gcc ate ggc gcg gtg acg ata gcg gtg gtg tec gcc ggc ate ggc ggc gcg gcc gca 
leu ala ile gly ala val thr ile ala val val ser ala gly ile gly gly ala ala ala 
781/261 811/271 

tec ctg gtc ggg ttc aac egg gca ccc gcc ggc ccc age ggc ggc cca gtg get gcc age 
ser leu val gly phe asn arg ala pro ala gly pro ser gly gly pro val ala ala ser 
841/281 871/291 

gcg gcg cca age ate ccc gca gca aac atg ccg ccg ggg teg gtc gaa cag gtg gcg gcc 
ala ala pro ser ile pro ala ala asn met pro pro gly ser val glu gin val ala ala 



SEQ ID N° 49F 
FIGURE 49F 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



175/185 



901/301 

aag gtg gtg ccc agt 
lys val val pro ser 
961/321 

tec ggc ate att ctg 
ser gly ile ile leu 
1021/341 

gee gec aag cct ccc 
ala ala lys pro pro 
1081/361 

egg acc gca ccc ttc 
arg thr ala pro phe 
1141/381 

gtt cag ggc gtc tec 
val gin gly val ser 
1201/401 

ggt cag ccg gtg ctg 
gly gin pro val leu 
1261/421 

ate gtc age get etc 
ile val ser ala leu 
1321/441 

gtg ctg gac gee att 
val leu asp ala ile 
1381/461 

gtg aac atg aac get 
val asn met asn ala 
1441/481 

tea gee gat gcg cag 
ser ala asp ala gin 
1501/501 

aag cgc ate gee gac 
lys arg ile ala asp 
1561/521 

cag gtg acc aat gac 
gin val thr asn asp 
1621/541 

get gee gcg aac get 
ala ala ala asn ala 
1681/561 

ate aac age gcg gac 
ile asn ser ala asp 
1741/581 

gcg eta acc ttt cag 

ala leu thr phe gin 

1801/601 

gcg gag cag tga 

ala glu gin OPA 



gtc gtc atg ttg gaa 
val val met leu glu 

tct gee. gag ggg ctg 
ser ala glu gly leu 

ctg ggc agt ccg ccg 
leu gly ser pro pro 

acg gtg gtg ggg get 
thr val val gly ala 

ggg etc acc ccg ate 
gly leu thr pro ile 

gcg ate ggg teg ccg 
ala ile gly ser pro 

aac cgt cca gtg teg 
asn arg pro val ser 

cag acc gac gee gcg 
gin thr asp ala ala 

caa etc gtc gga gtc 
gin leu val gly val 

age ggc teg ate ggt 
ser gly ser ile gly 

gag ttg ate age acc 
glu leu ile ser thr 

aaa gac acc ctg ggc 
lys asp thr leu gly 

gga gtg ccg aag ggc 
gly val pro lys gly 

gcg ttg gtt gee gec 
ala leu val ala ala 

gat ccc teg ggc ggt 
asp pro ser gly gly 



931/311 

acc gat ctg ggc cgc 
thr asp leu gly arg 
991/331 

ate ttg acc aac aac 
ile leu thr asn asn 
1051/351 

ccg aaa acg acg gta 
pro lys thr thr val 
1111/371 

gac ccc acc agt gat 
asp pro thr ser asp 
1171/391 

tec ctg ggt tec tec 
ser leu gly ser ser 
1231/411 

etc ggt ttg gag ggc 
leu gly leu glu gly 
1291/431 

acg acc ggc gag gec 
thr thr gly glu ala 
1351/451 

ate aac ccc ggt aac 
ile asn pro gly asn 
1411/471 

aac teg gec att gec 
asn ser ala ile ala 
1471/491 

etc ggt ttt gcg att 
leu gly phe ala ile 
1531/511 

ggc aag gcg tea cat 
gly lys ala ser his 
1591/531 

gec aag ate gtc gaa 
ala lys ile val glu 
1651/551 

gtc gtt gtc acc aag 
val val val thr lys 
1711/571 

gtg egg tec aaa gcg 
val arg ser lys ala 
1771/591 

age cgc aca gtg caa 
ser arg thr val gin 



cag teg gag gag ggc 
gin ser glu glu gly 

cac gtg ate gcg gcg 
his val ile ala ala 

acc ttc tct gac ggg 
thr phe ser asp gly 

ate gec gtc gtc cgt 
ile ala val val arg 

teg gac ctg agg gtc 
ser asp leu arg val 

acc gtg acc acg ggg 
thr val thr thr gly 

ggc aac cag aac acc 
gly asn gin asn thr 

tec ggg ggc gcg ctg 
ser gly gly ala leu 

acg ctg ggc gcg gac 
thr leu gly ala asp 

cca gtc gac cag gee 
pro val asp gin ala 

gee tec ctg ggt gtg 
ala ser leu gly val 

gta gtg gee ggt ggt 
val val ala gly gly 

gtc gac gac cgc ccg 
val asp asp arg pro 

ccg ggc gee acg gtg 
pro gly ala thr val 

gtc acc etc ggc aag 
val thr leu gly lys 



SEQ ID N° 49F (suite 1) 
FIGURE 49F (suite 1) 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



176/185 

Fragment amplifie par PCR d^pres les similarites de sequence avec une serine protease de 
la famille HtrA de E, coli (creation du site SnaBI a l'extremite 3') et sous clone dans 
le vecteur pJVEDa: 

1/1 31/11 

gat ccg gcg ggg egg gtg teg gcg cag gcg tgg ctg gcg gtc acg gcg gtg egg gcg gtg 
asp pro ala gly arg val ser ala gin ala trp leu ala val thr ala val arg ala val 
€1/21 91/31 

ccg ccg ggc tgt ggg gcg ccg gcg gcg gcg gtg gca atg gcg gga acg gcg ccg atg cca 
pro pro gly cys gly ala pro ala ala ala val ala met ala gly thr ala pro met pro 
121/41 151/51 

aca teg tea gcg gtg gag acg gtg gec teg gcg gtg ccg gtg gcg gtg gcg gat ggc tct 
thr ser ser ala val glu thr val ala ser ala val pro val ala val ala asp gly ser 
181/61 211/71 

acg gcg acg gcg ggg ccg gcg gac acg gcg gac aag gcg caa teg gec teg gcg gcg gcg 
thr ala thr ala gly pro ala asp thr ala asp lys ala gin ser ala ser ala ala ala 
241/81 271/91 

ccg gcg gcg acg ggg gec agg gcg gcg ccg gec gcg gac tgt ggg gta ctg gcg gcg ccg 
pro ala ala thr gly ala arg ala ala pro ala ala asp cys gly val leu ala ala pro 
301/101 331/111 

gcg gac acg gcg ggc aag gcg gtg gta ccg ggg gec cac cgc tgc ccg gtc agg cag gca 
ala asp thr ala gly lys ala val val pro gly ala his arg cys pro val arg gin ala 
361/121 391/131 

tgg gcg ccg egg gtg gcg ccg gtg ggc tga teg gca acg gcg ggg ccg gcg gcg acg gcg 
trp ala pro arg val ala pro val gly OPA ser ala thr ala gly pro ala ala thr ala 
421/141 451/151 

gtg teg gcg cgt ccg gcg ggg teg ccg gag tag gcg gtg ccg gcg gga acg cca tgc tga 
val ser ala arg pro ala gly ser pro glu AMB ala val pro ala gly thr pro cys OPA 
481/161 511/171 

teg ggc acg gcg gcg ccg gcg gcg ccg gcg gag aca gca gtt teg eta atg gcg egg ccg 
ser gly thr ala ala pro ala ala pro ala glu thr ala val ser leu met ala arg pro 
541/181 571/191 

gcg gcg egg gcg gtg ccg gag ggc acc tct teg gca atg gcg ggt ccg gcg gee acg gcg 
ala ala arg ala val pro glu gly thr ser ser ala met ala gly pro ala ala thr ala 
601/201 631/211 

gag ccg tea egg ccg gca aca ccg gta teg gtg gcg ccg gcg gcg teg gtg ggg acg cca 
glu pro ser arg pro ala thr pro val ser val ala pro ala ala ser val gly thr pro 
661/221 691/231 

ggc tga teg gec acg gtg gcg ccg gcg gtg ccg gcg ggg acc gcg ccg gag cct tgg ttg 
gly OPA ser ala thr val ala pro ala val pro ala gly thr ala pro glu pro trp leu 
721/241 751/251 

gec gtg acg gcg ggc ccg gtg gga acg ggg gcg ctg gcg gee age tat acg gca acg gcg 
ala val thr ala gly pro val gly thr gly ala leu ala ala ser tyr thr ala thr ala 
781/261 811/271 

gcg acg gcg ccc ccg gca ccg gcg gaa cac tgc agg egg egg tga gcg gat tgg tga egg 
ala thr ala pro pro ala pro ala glu his cys arg arg arg OPA ala asp trp OPA arg 
841/281 871/291 

ctt tgt teg gtg cac ccg gec aac ccg gcg aca ccg gec aac ccg get age ccc gat caa 
leu cys ser val his pro ala asn pro ala thr pro ala asn pro ala ser pro asp gin 
901/301 931/311 

cga ggg ttt egg tgc egg tec ggg gca tgg cca tec get gag ctg gcg ate tgg act acg 
arg gly phe arg cys arg ser gly ala trp pro ser ala glu leu ala ile trp thr thr 
961/321 991/331 

ttg gtg tag aaa aat cct gec gec egg acc ctt aag get ggg aca att tct gat age tac 
leu val AMB lys asn pro ala ala arg thr leu lys ala gly thr ile ser asp ser tyr 
1021/341 1051/351 

ccc gac aca gga ggt tac ggg atg age aat teg cgc cgc cgc tea etc agg tgg tea tgg 
pro asp thr gly gly tyr gly met ser asn ser arg arg arg ser leu arg trp ser trp 
1081/361 1111/371 

ttg ctg age gtg ctg get gec gtc ggg ctg ggc ctg gec acg gcg ccg gee cag gcg gec 
leu leu ser val leu ala ala val gly leu gly leu ala thr ala pro ala gin ala ala 
1141/381 

ccg ccg gee ttg teg cag gac egg tt 
pro pro ala leu ser gin asp arg 



SEQ ID N° 50A 
FEUILLE DE REMP^C^E^tREGLE 26) 



WO 99/09186 



PCT/FR98/01813 
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1/1 31/11 

ate egg egg ggc ggg tgt egg cgc agg cgt ggc tgg egg tea egg egg tgc ggg egg tgc 
ile arg arg gly gly cys arg arg arg arg gly trp arg ser arg arg cys gly arg cys 
61/21 91/31 

cgc egg get gtg ggg cgc egg egg egg egg tgg caa tgg egg gaa egg cgc cga tgc caa 
arg arg ala val gly arg arg arg arg arg trp gin trp arg glu arg arg arg cya gin 
121/41 151/51 

cat cgt cag egg tgg aga egg tgg cct egg egg tgc egg tgg egg tgg egg atg get eta 
his arg gin arg trp arg arg trp pro arg arg cya arg trp arg trp arg met ala leu 
181/61 211/71 

egg cga egg egg ggc egg egg aca egg egg aca agg cgc aat egg cct egg egg egg cgc 
arg arg arg arg gly arg arg thr arg arg thr arg arg asn arg pro arg arg arg arg 
241/81 271/91 

egg egg cga egg ggg cca ggg egg cgc egg ccg egg act gtg ggg tac tgg egg cgc egg 
arg arg arg arg gly pro gly arg arg arg pro arg thr val gly tyr trp arg arg arg 
301/101 331/111 

egg aca egg egg gca agg egg tgg tac egg ggg ccc acc get gee egg tea ggc agg cat 
arg thr arg arg ala arg arg trp tyr arg gly pro thr ala ala arg aer gly arg his 
361/121 391/131 

ggg cgc cgc ggg tgg cgc egg tgg get gat egg caa egg egg ggc egg egg cga egg egg 
gly arg arg gly trp arg arg trp ala asp arg gin arg arg gly arg arg arg arg arg 
421/141 451/151 

tgt egg cgc gtc egg egg ggt cgc egg agt agg egg tgc egg egg gaa cgc cat get gat 
cys arg arg val arg arg gly arg arg ser arg arg cys arg arg glu arg his ala asp 
481/161 511/171 

egg gca egg egg cgc egg egg cgc egg egg aga cag cag ttt cgc taa tgg cgc ggc egg 
arg ala arg arg arg arg arg arg arg arg arg gin gin phe arg OCH trp arg gly arg 
541/181 571/191 

egg cgc ggg egg tgc egg agg gca cct ctt egg caa tgg egg gtc egg egg cca egg egg 
arg arg gly arg cys arg arg ala pro leu arg gin trp arg val arg arg pro arg arg 
601/201 631/211 

age cgt cac ggc egg caa cac egg tat egg tgg cgc egg egg cgt egg tgg gga cgc cag 
ser arg his gly arg gin his arg tyr arg trp arg arg arg arg arg trp gly arg gin 
661/221 691/231 

get gat egg cca egg tgg cgc egg egg tgc egg egg gga ccg cgc egg age ctt ggt tgg 
ala asp arg pro arg trp arg arg arg cys arg arg gly pro arg arg ser leu gly trp 
721/241 751/251 

ccg tga egg egg gee egg tgg gaa egg ggg cgc tgg egg cca get ata egg caa egg egg 
pro OPA arg arg ala arg trp glu arg gly arg trp arg pro ala ile arg gin arg arg 
781/261 811/271 

cga egg cgc ccc egg cac egg egg aac act gca ggc ggc ggt gag egg att ggt gac ggc 
arg arg arg pro arg his arg arg asn thr ala gly gly gly glu arg ile gly asp gly 
841/281 871/291 

ttt gtt egg tgc acc egg cca acc egg cga cac egg cca acc egg eta gee ccg ate aac 
phe val arg cys thr arg pro thr arg arg his arg pro thr arg leu ala pro ile asn 
901/301 931/311 

gag ggt ttc ggt gee ggt ccg ggg cat ggc cat ccg ctg age tgg cga tct gga eta cgt 
glu gly phe gly ala gly pro gly his gly his pro leu ser trp arg aer gly leu arg 
961/321 991/331 

tgg tgt aga aaa ate ctg ccg ccc gga ccc tta agg ctg gga caa ttt ctg ata get acc 
trp cya arg lys ile leu pro pro gly pro leu arg leu gly gin phe leu ile ala thr 
1021/341 1051/351 

ccg aca cag gag gtt acg gga tga gca att cgc gee gee get cac tea ggt ggt cat ggt 
pro thr gin glu val thr gly OPA ala ile arg ala ala ala his ser gly gly his gly 
1081/361 1111/371 

tgc tga gcg tgc tgg ctg ccg teg ggc tgg gee tgg cca egg cgc egg ccc agg egg ccc 
cya OPA ala cys trp leu pro ser gly trp ala trp pro arg arg arg pro arg arg pro 
1141/381 

cgc egg cct tgt cgc agg acc ggt t 
arg arg pro cys arg arg thr gly 
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1/1 

tec ggc ggg gcg ggt gtc ggc gca ggc gtg 
ser gly gly ala gly val gly ala gly val 
61/21 

gec ggg ctg tgg ggc gec ggc ggc ggc ggt 
ala gly leu trp gly ala gly gly gly gly 
121/41 

ate gtc age ggt gga gac ggt ggc etc ggc 
ile val ser gly gly asp gly gly leu gly 
181/61 

ggc gac ggc ggg gec ggc gga cac ggc gga 
gly asp gly gly ala gly gly his gly gly 
241/81 

ggc ggc gac ggg ggc cag ggc ggc gec ggc 
gly gly asp gly gly gin gly gly ala gly 
301/101 

gga cac ggc ggg caa ggc ggt ggt acc ggg 
gly his gly gly gin gly gly gly thr gly 
361/121 

ggc gec gcg ggt ggc gee ggt ggg ctg ate 
gly ala ala gly gly ala gly gly leu ile 
421/141 

gtc ggc gcg tec ggc ggg gtc gee gga gta 
val gly ala ser gly gly val ala gly val 
481/161 

ggg cac ggc ggc gee ggc ggc gee ggc gga 
gly his gly gly ala gly gly ala gly gly 
541/181 

ggc gcg ggc ggt gec gga ggg cac etc ttc 
gly ala gly gly ala gly gly his leu phe 
601/201 

gec gtc acg gee ggc aac acc ggt ate ggt 
ala val thr ala gly asn thr gly ile gly 
661/221 

ctg ate ggc cac ggt ggc gee ggc ggt gee 
leu ile gly his gly gly ala gly gly ala 
721/241 

cgt gac ggc ggg ccc ggt ggg aac ggg ggc 
arg asp gly gly pro gly gly asn gly gly 
781/261 

gac ggc gee ccc ggc acc ggc gga aca ctg 
asp gly ala pro gly thr gly gly thr leu 
841/281 

ttg ttc ggt gca ccc ggc caa ccc ggc gac 
leu phe gly ala pro gly gin pro gly asp 
901/301 

agg gtt teg gtg ccg gtc egg ggc atg gee 
arg val ser val pro val arg gly met ala 
961/321 

ggt gta gaa aaa tec tgc cgc ccg gac cct 
gly val glu lys ser cys arg pro asp pro 
1021/341 

cga cac agg agg tta egg gat gag caa ttc 
arg his arg arg leu arg asp glu gin phe 
1081/361 

get gag cgt get ggc tgc cgt egg get ggg 
ala glu arg ala gly cys arg arg ala gly 
1141/381 

gec ggc ctt gtc gca gga ccg gtt 
ala gly leu val ala gly pro val 



31/11 

get ggc ggt cac ggc ggt gcg ggc ggt gee 
ala gly gly his gly gly ala gly gly ala 
91/31 

ggc aat ggc ggg aac ggc gec gat gec aac 
gly asn gly gly asn gly ala asp ala asn 
151/51 

ggt gec ggt ggc ggt ggc gga tgg etc tac 
gly ala gly gly gly gly gly trp leu tyr 
211/71 

caa ggc gca ate ggc etc ggc ggc ggc gee 
gin gly ala ile gly leu gly gly gly ala 
271/91 

cgc gga ctg tgg ggt act ggc ggc gec ggc 
arg gly leu trp gly thr gly gly ala gly 
331/111 

ggc cca ccg ctg ccc ggt cag gca ggc atg 
gly pro pro leu pro gly gin ala gly met 
391/131 

ggc aac ggc ggg gee ggc ggc gac ggc ggt 
gly asn gly gly ala gly gly asp gly gly 
451/151 

ggc ggt gee ggc ggg aac gee atg ctg ate 
gly gly ala gly gly asn ala met leu ile 
511/171 

gac age agt ttc get aat ggc gcg gee ggc 
asp ser ser phe ala asn gly ala ala gly 
571/191 

ggc aat ggc ggg tec ggc ggc cac ggc gga 
gly asn gly gly ser gly gly his gly gly 
631/211 

ggc gee ggc ggc gtc ggt ggg gac gee agg 
gly ala gly gly val gly gly asp ala arg 
691/231 

ggc ggg gac cgc gec gga gee ttg gtt ggc 
gly gly asp arg ala gly ala leu val gly 
751/251 

get ggc ggc cag eta tac ggc aac ggc ggc 
ala gly gly gin leu tyr gly asn gly gly 
811/271 

cag gcg gcg gtg age gga ttg gtg acg get 
gin ala ala val ser gly leu val thr ala 
871/291 

acc ggc caa ccc ggc tag ccc cga tea acg 
thr gly gin pro gly AMB pro arg ser thr 
931/311 

ate cgc tga get ggc gat ctg gac tac gtt 
ile arg OPA ala gly asp leu asp tyr val 
991/331 

taa ggc tgg gac aat ttc tga tag eta ccc 
OCH gly trp asp asn phe OPA AMB leu pro 
1051/351 

gcg ccg ccg etc act cag gtg gtc atg gtt 
ala pro pro leu thr gin val val met val 
1111/371 

cct ggc cac ggc gec ggc cca ggc ggc ccc 
pro gly his gly ala gly pro gly gly pro 
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Sequence codante Rv0125 predite par Cole et al., 
contenant seqSOA: 



1998 (Nature 393:537-544) et 



1/1 

atg age 
Met ser 
61/21 
gtc ggg 
val gly 
121/41 
egg ttc 
arg phe 
181/61 
cca cag 
pro gin 
241/81 
ggc ate 
gly ile 
301/101 
acc gac 
thr asp 
361/121 
tat gac 
tyr asp 
421/141 
gcg gcg 
ala ala 
481/161 
ggg cag 
gly gin 
541/181 
cag gcg 
gin ala 
601/201 
gec gcg 
ala ala 
661/221 
ggt atg 
gly met 
721/241 
att ccg 
ile pro 
781/261 
acc gtt 
thr val 
841/281 
ggc gca 
gly ala 
901/301 
ggc gac 
gly asp 
961/321 
gcg ctt 
ala leu 
1021/34 
ggc acg 
gly thr 



aat teg cgc cgc cgc tea etc 
asn ser arg arg arg ser leu 

ctg ggc ctg gec acg gcg ccg 
leu gly leu ala thr ala pro 

gec gac ttc ccc gcg ctg ccc 
ala asp phe pro ala leu pro 

gtg gtc aac ate aac acc aaa 
val val asn ile asn thr lys 

gtc ate gat ccc aac ggt gtc 
val ile asp pro asn gly val 

ate aat gcg ttc age gtc ggc 
ile asn ala phe ser val gly 

cgc acc cag gat gtc gcg gtg 
arg thr gin asp val ala val 

ate ggt ggc ggc gtc gcg gtt 
ile gly gly gly val ala val 

ggc gga acg ccc cgt gcg gtg 
gly gly thr pro arg ala val 

teg gat teg ctg acc ggt gec 
ser asp ser leu thr gly ala 

ate cag ccc ggt gat teg ggc 
ile gin pro gly asp ser gly 

aac acg gec gcg tec gat aac 
asn thr ala ala ser asp asn 

ate ggg cag gcg atg gcg ate 
ile gly gin ala met ala ile 

cat ate ggg cct acc gee ttc 
his ile gly pro thr ala phe 

cga gtc caa cgc gtg gtc ggg 
arg val gin arg val val gly 

gtg ate acc gcg gtc gac ggc 
val ile thr ala val asp gly 

aac ggg cat cat ccc ggt gac 
asn gly his his pro gly asp 

cgt aca ggg aac gtg aca ttg 
arg thr gly asn val thr leu 



31/11 
agg tgg tea tgg 
arg trp ser trp 

91/31 
gec cag gcg gec 
ala gin ala ala 

151/51 
etc gac ccg tec 
leu asp pro ser 

211/71 
ctg ggc tac aac 
leu gly tyr asn 

271/91 
gtg ctg acc aac 
val leu thr asn 

331/111 
tec ggc caa acc 
ser gly gin thr 

391/131 
ctg cag ctg cgc 
leu gin leu arg 

451/151 
ggt gag ccc gtc 
gly glu pro val 

511/171 
cct ggc agg gtg 
pro gly arg val 

. 571/191 
gaa gag aca ttg 
glu glu thr leu 

631/211 
ggg ccc gtc gtc 
gly pro val val 

691/231 
ttc cag ctg tec 
phe gin leu ser 

751/251 
gcg ggc cag ate 
ala gly gin ile 

811/271 
etc ggc ttg ggt 
leu gly leu gly 

871/291 
age get ccg gcg 
ser ala pro ala 

931/311 
get ccg ate aac 
ala pro ile asn 

991/331 
gtc ate teg gtg 
val ile ser val 

1051/351 
gec gag gga ccc 
ala glu gly pro 



ttg ctg age gtg 
leu leu ser val 

ccg ccg gee ttg 
pro pro ala leu 

gcg atg gtc gee 
ala met val ala 

aac gec gtg ggc 
asn ala val gly 

aac cac gtg ate 
asn his val ile 

tac ggc gtc gat 
tyr gly val asp 

ggt gee ggt ggc 
gly ala gly gly 

gtc gcg atg ggc 
val ala met gly 

gtc gcg etc ggc 
val ala leu gly 

aac ggg ttg ate 
asn gly leu ile 

aac ggc eta gga 
asn gly leu gly 

cag ggt ggg cag 
gin gly gly gin 

cga teg ggt ggg 
arg ser gly gly 

gtt gtc gac aac 
val val asp asn 

gca agt etc ggc 
ala ser leu gly 

teg gec acc gcg 
ser ala thr ala 

acc tgg caa acc 
thr trp gin thr 

ccg gec tga 
pro ala OPA 



ctg get gec 
leu ala ala 

teg cag gac 
ser gin asp 

caa gtg ggg 
gin val gly 

gec ggg acc 
ala gly thr 

gcg ggc gee 
ala gly ala 

gtg gtc ggg 
val val gly 

ctg ccg teg 
leu pro ser 

aac age ggt 
asn ser gly 

caa acc gtg 
gin thr val 

cag ttc gat 
gin phe asp 

cag gtg gtc 
gin val val 

gga ttc gee 
gly phe ala 

ggg tea ccc 
gly ser pro 

aac ggc aac 
asn gly asn 

ate tec acc 
ile ser thr 

atg gcg gac 
met ala asp 

aag teg ggc 
lys ser gly 
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ORF d'apres Cole et al., 1998 (Nature 393:537-544) et contenant Rv0125: 
1/1 31/11 

tag aaa aat cct gcc gcc egg acc ctt aag get ggg aca att tct gat age tac ccc gac 
AMB lys asn pro ala ala arg thr leu lys ala gly thr ile ser asp ser tyr pro asp 
$1/21 91/31 

aca gga ggt tac ggg atg age aat teg cgc cgc cgc tea etc agg tgg tea tgg ttg ctg 
thr gly gly tyr gly met ser asn ser arg arg arg ser leu arg trp ser trp leu leu 
121/41 151/51 

age gtg ctg get gcc gtc ggg ctg ggc ctg gcc acg gcg ccg gcc cag gcg gcc ccg ccg 
ser val leu ala ala val gly leu gly leu ala thr ala pro ala gin ala ala pro pro 
181/61 211/71 

gcc ttg teg cag gac egg ttc gcc gac ttc ccc gcg ctg ccc etc gac ccg tec gcg atg 
ala leu ser gin asp arg phe ala asp phe pro ala leu pro leu asp pro ser ala met 
241/81 271/91 

gtc gcc caa gtg ggg cca cag gtg gtc aac ate aac acc aaa ctg ggc tac aac aac gcc 
val ala gin val gly pro gin val val asn ile asn thr lys leu gly tyr asn asn ala 
301/101 331/111 

gtg ggc gcc ggg acc ggc ate gtc ate gat ccc aac ggt gtc gtg ctg acc aac aac cac 
val gly ala gly thr gly ile val ile asp pro asn gly val val leu thr asn asn his 
361/121 391/131 

gtg ate gcg ggc gcc acc gac ate aat gcg ttc age gtc ggc tec ggc caa acc tac ggc 
val ile ala gly ala thr asp ile asn ala phe ser val gly ser gly gin thr tyr gly 
421/141 451/151 

gtc gat gtg gtc ggg tat gac cgc acc cag gat gtc gcg gtg ctg cag ctg cgc ggt gcc 
val asp val val gly tyr asp arg thr gin asp val ala val leu gin leu arg gly ala 
481/161 511/171 

ggt ggc ctg ccg teg gcg gcg ate ggt ggc ggc gtc gcg gtt ggt gag ccc gtc gtc gcg 
gly gly leu pro ser ala ala ile gly gly gly val ala val gly glu pro val val ala 
541/181 571/191 

atg ggc aac age ggt ggg cag ggc gga acg ccc cgt gcg gtg cct ggc agg gtg gtc gcg 
met gly asn ser gly gly gin gly gly thr pro arg ala val pro gly arg val val ala 
601/201 631/211 

etc ggc caa acc gtg cag gcg teg gat teg ctg acc ggt gcc gaa gag aca ttg aac ggg 
leu gly gin thr val gin ala ser asp ser leu thr gly ala glu glu thr leu asn gly 
661/221 691/231 

ttg ate cag ttc gat gcc gcg ate cag ccc ggt gat teg ggc ggg ccc gtc gtc aac ggc 
leu ile gin phe asp ala ala ile gin pro gly asp ser gly gly pro val val asn gly 
721/241 751/251 

eta gga cag gtg gtc ggt atg aac acg gcc gcg tec gat aac ttc cag ctg tec cag ggt 
leu gly gin val val gly met asn thr ala ala ser asp asn phe gin leu ser gin gly 
781/261 811/271 

ggg cag gga ttc gcc att ccg ate ggg cag gcg atg gcg ate gcg ggc cag ate cga teg 
gly gin gly phe ala ile pro ile gly gin ala met ala ile ala gly gin ile arg ser 
841/281 871/291 

ggt ggg ggg tea ccc acc gtt cat ate ggg cct acc gcc ttc etc ggc ttg ggt gtt gtc 
gly gly gly ser pro thr val his ile gly pro thr ala phe leu gly leu gly val val 
901/301 931/311 

gac aac aac ggc aac ggc gca cga gtc caa cgc gtg gtc ggg age get ccg gcg gca agt 
asp asn asn gly asn gly ala arg val gin arg val val gly ser ala pro ala ala ser 
961/321 991/331 

etc ggc ate tec acc ggc gac gtg ate acc gcg gtc gac ggc get ccg ate aac teg gcc 
leu gly ile ser thr gly asp val ile thr ala val asp gly ala pro ile asn ser ala 
1021/341 1051/351 

acc gcg atg gcg gac gcg ctt aac ggg cat cat ccc ggt gac gtc ate teg gtg acc tgg 
thr ala met ala asp ala leu asn gly his his pro gly asp val ile ser val thr trp 
1081/361 1111/371 

caa acc aag teg ggc ggc acg cgt aca ggg aac gtg aca ttg gcc gag gga ccc ccg gcc 

gin thr lys ser gly gly thr arg thr gly asn val thr leu ala glu gly pro pro ala 

1141/381 

tga 

OPA 
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Experiences d f hybridation mo!6culaire d'une sonde sp6cifique 
du DP428 sur l'ADN g£nomique de diff6rentes espdces de 
mycobact6ries 



1 2 3 4 56 7 8 9 10111213 




1: M. tuberculosis 2: M. bovis 3: BCG 4: M. africanum 5: cancelled 6 
fortuitum 7: M. simiae 8: M. avium 9: M. chelonae 10: M. flavescens 11 
gordonae 12: M. marinum 13: M, kansasii 
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